НЯКОЛКО ДУМИ ЗА СРИЧКОПРЕНАСЯНЕТО

Морфология срещу прост алгоритъм

Хората със здрав разум (и завършено средно образование) дълбоко в душата си интуитивно знаят, че пренасянето на думите е най-добре да става на морфемен принцип. Основният проблем обаче идва от там, че за своите 147 години от създаването си, БАН не е успяла да състави и издаде морфологичен речник на българския език, в който биха били указани възможните места за преноси в думите. За да се излезе от тази неприятна ситуация, са наложени прости правила, базирани на прости алгоритми и предназначени за непретенциозна аудитория. Надявам се, че мнозина от нас не се асоциират с тази капитулация...

За онези, които не са съвсем наясно със строежа на думата и с понятието морфема, ще се опитам по-долу да обясня нагледно културното разрешаване на проблема със сричкопренасянето.

Представете си, че сте отишли в магазин и сте си купили следната наденица:

наденица-1

Сега се замислете: как естетически е най-издържано и елегантно да си я напъхате в джобовете и да си я отнесете с достойнство вкъщи?

наденица-2

Естествено първият ни опит (1) ще бъде да я напъхаме изцяло в левия си джоб. Ако наденицата обаче е прекалено дълга и би стърчала навън, следва да направим втори опит (2) като преценим дали да не я разделим на две между двете най-големи (и съществени) части. Ако поради някаква причина (наличието и на други ценни продукти в двата ни джоба) отново не успеем, ще се замислим дали да не я разделим при някое от по-малките парчета (3). Ако и това поради някаква причина не би удовлетворило чувството ни за баланс, ще се наложи да срежем наденицата (4) на някое от другите две логични места.

Ето как по същия начин и логика стои въпросът със сричкопренасянето на думата „едностепенният":

наденица-3

(За строежа на думите и за причината поради която между тази дума и начертаната наденица липсва съществена разлика, моля прочетете това) Ако разсъждаваме пак върху начините на прекъсване, може да направим следната приоритетна таблица с нашите опити:

1-ви опит едностепенният
2-ри опит едно-степенният
3-ти опит едностепен-ният / едностепенни-ят
4-ти опит ед-ностепенният / едносте-пенният

Ако трябва да обобщим – първо трябва да се опитаме да разделим думата на морфологичните й части (започвайки от най-важните части), а след това разделяме и отделните морфеми на срички (надявам се дори и тези, които не са успели да завършат средно образование, са съгласни, че съгласната буква сама по себе си не може да е сричка...).

Как обаче според БАН трябва да си напъхате тази наденица в джобовете? Според техните алгоритми това става така:

наденица-5

т.е. след като в случая имаме 5 посочени равносилни (тъй като БАН не биха посмели и в бъдещите 147 години на съзряване да усложнят допълнително задачата си с въвеждането и на различни тежести/предпочитания при разделянето...) възможности за пренос, то в 1/5 от случаите ще бъдем свидетели на следната ситуация:

наденица-4

Аз лично съм убеден, че нито един културен и разумно мислещ човек не би се гордял в единия си джоб да държи парчето „еднос“, а в другия – „тепенният". Нито пък бих изпитвал уважение към някой, който си държи думите по следния начин (според БАН):

нап-редничав, предс-тавка, велосипедис-тка, предп-риятие, безк-раен, пос-ледващ, зах-ват...

Ако имате различно мнение, първо може да прочетете малко по-неилюстративната и суха теоретична част върху алгоритмите при сричкопренасянето, а след това сте добре дошли да го изпратите чрез контакти.

напред >>

Съдържание

0. Встъпление

1. Увод

2. Сричкопренасяне

2.1. Малко история

2.2. Правила за сричкопренасяне от 1983 г.

2.3. Метод на скандирането

2.4. Алгоритъм на сричкопренасянето по фонетичен и морфологичен принцип

2.4.1. Алгоритъм за откриване на морфема в дума

2.4.2. Алгоритъм за анализ на буква

2.4.3. Алгоритъм за анализ на дума

2.4.4. Алгоритъм за анализ на текст

2.4.5. Други възможности

3. Автоматизирано откриване и отстраняване на грешки в текст

3.1. Дефиниции и понятия

3.2. Често допускани грешки

3.3. Класификация на правилата

3.4. Примерна програмна реализация на локалните правила

3.4.1. Нови дефиниции, променливи, флагове и множества

3.4.2. Таблица на локалните правила

3.4.3. Функции, необходими за реализация на локалните правила

3.5. Глобални правила

3.5.1. Класификация на думите в текст на равнище знакове

3.5.2. Функции, необходими за реализация на глобалните правила

3.5.3. Функции и идеи, които предстоят да бъдат осъществени

4. Някои метрики в текстообработката

4.1. Текстови и шрифтови метрики

4.2. Сложност на текст

4.3. Професионализъм на предпечатната подготовка

4.3.1. Използване на възможностите на програмите чрез дефиниране на различни стилове

4.3.2. Премахване на излишното форматиране

4.3.3. Използване на възможностите за настройка на основните отношения между и в параграфите

5. Заключение

6. Литература

7. Приложениe

7.1. Списък на книгите, върху които са направени експерименти

7.2. Някои статистики и резултати от проведени изследвания