ПРОБЛЕМНЫЕ ИМЕНА СОБСТВЕННЫЕ И КОМПЬЮТЕРНАЯ КОРРЕКЦИЯ ОРФОГРАФИИ ТЕКСТОВ Лавошникова Э.К.

Московский государственный университет им. М.В. Ломоносова; Научно-исследовательский вычислительный центр, г. Москва


Номер: 9-1
Год: 2015
Страницы: 81-85
Журнал: Актуальные проблемы гуманитарных и естественных наук

Ключевые слова

фамилии, орфографические ошибки, спеллер, программа-подсказка, MS Word 2013, names, spelling errors, speller, program-tip, MS Word 2013

Просмотр статьи

⛔️ (обновите страницу, если статья не отобразилась)

Аннотация к статье

В статье рассматриваются причины пропуска спеллером Microsoft Word’2013 ошибок в написании имен, отчеств, фамилий и топонимов, а также в нарицательных существительных. Приводятся примеры пропуска спеллером ошибок и опечаток в результате включения в системные словари текстового редактора WORD некоторых фамилий и уменьшительных имен.

Текст научной статьи

В книге, содержащей ровно 256 страниц («сакральное» число для компьютерщиков), Ирина Спира пишет: «Традиционная проверка правописания была реализована в Microsoft Word на высоком уровне. Программа замечала не только орфографические ошибки, но и «чувствовала» весьма тонкие грамматические и стилистические нюансы, решала даже непростые пунктуационные задачи. Но в Microsoft Word 2013 качество проверки правописания русского текста заметно ухудшилось» [5,59]. Мы не будем в настоящей статье обсуждать качество проверки стилистики или пунктуации. Но даже в наиболее разработанном направлении - выявлении орфографических ошибок - в Word’2013 еще остается немало разного рода недочетов (к примеру, см. нашу работу [3,72]). Четвертое издание «Грамматического словаря» академика РАН Андрея Анатольевича Зализняка с обратным алфавитным порядком (последнее слово «несовершеннолетнЯЯ») дополнено приложением «Имена собственные» (более 8 тыс. словарных статей) [1,731]. Однако версии текстового редактора MS Word разных лет, базирующиеся на первых изданиях словаря Зализняка, еще до выхода 4-го издания (т. е. до 2003 года) уже содержали небольшие системные словари имен собственных. Если написать имя императрицы, дочери Петра Первого, по-старинному «Елисаветъ», то в текстовом редакторе Word это слово будет подчеркнуто красной волнистой линией, а подсказка-2013 выдаст имя Елизавета в разных падежах. Королеву Великобритании мы по традиции тоже зовем Елизаветой (не Элизабет), а ее покойную невестку принцессой Дианой. Владимир Андреевич Успенский в одной из своих книг [5,488] вполне резонно замечает: «Когда современный принц Уэльский, наследник британской королевы Елизаветы II, да продлятся годы её счастливого царствования, сделается королём, станет ли он Карлом III или так и останется Чарльзом?» и далее [5,515] приводит интересные факты перевода имен собственных, например: «Английское Hudson переводится как Гудзон, если означает реку, на которой стоит город Нью-Йорк, и как Хадсон, если означает квартирную хозяйку Шерлока Холмса. Английское Lovelace, когда означает героя упомянутого в “Евгении Онегине” романа Ричардсона “Кларисса Гарлоу”, переводится как Ловелас, а когда означает первую в мире программистку, дочь Байрона леди Аду, - то как Лавлейс». Красной волнистой линией в текстах подчеркиваются отдельные слова (или даже части сложных слов при написании через дефис), отсутствующие в Word’овских системных словарях. Тем самым пользователю предлагается обратить на них внимание - нет ли в них ошибки или опечатки. Программа-подсказка после замен, вставок, удаления и перестановок некоторых символов ищет в системных словарях полученные «похожие» слова, т. е. буквосочетания. Если находит, то выдает список таких словоформ как возможные варианты исправления неопознанного слова. К сожалению, не всегда слова с орфографическими ошибками и опечатками выявляются спеллером текстового редактора Word’2013. В разных версиях Ворда не подчеркивается ни устаревшее написание грегорианский, ни григорианский, рекомендуемое словарями [1,279; 4,157]. Версии текстового редактора Word, как предыдущие, так и 2013 года, «не знают» отыменного прилагательного лермонтовский, в то время как слова пушкинский, гоголевский и толстовский пропускаются без замечаний. В правильно написанном «Людвиг ван Бетховен» спеллер подчеркивает «ван» и при вызове подсказки предлагает среди прочих вариантов «Ван» с прописной буквы. Не всем известно, что литературный псевдоним американского писателя О. Генри пишется через точку, а не через апостроф [1,757]. Однако во внутреннем системном словаре имен собственных Word’овского автокорректора имеется словарная единица «О'Генри». Имя с ошибочной вставкой пробела «Надеж да» не подчеркивается, так как в системном словаре есть просторечное «надёжа». О перегруженности Word’овских системных словарей низкочастотной лексикой, которая мешает поиску и исправлению ошибок, мы писали в работе [2,52] и других. Можно привести немало примеров, когда «богатство» словаря имен собственных мешает выявлять слова с ошибками. Допустим, в тексте встретится начинающее фразу словосочетание «Даная статья…» с распространенной опечаткой - пропуском буквы. Такая ошибка не будет замечена Вордом, поскольку в его системном словаре есть имя Даная. Спеллер не подчеркивает возможные разбиения «Влади мир», «Влади слав» или «Влади лен» (немодное уже имя от «Владимир Ленин») с ошибочной вставкой пробела - очевидно, по причине присутствия в системном словаре фамилии-псевдонима актрисы Марины Влади (Поляковой), так как «Владя» подчеркивается красным. Написание «Филип» с одной буквой «п» пропускается спеллером без замечаний (наверное, при включении в системный словарь имелся в виду давно умерший киноактер Жерар Филип). При проверке фразы «Катинька, я вас люблю безумно!» (из рассказа Чехова «Жалобная книга») первое слово подчеркивается красной волнистой линией, а подсказка-2013 предлагает написание по современным правилам русского языка - КатЕнька. При этом «катенька» со строчной буквы подчеркивается. Это говорит нам о том, что имя Катенька (как и Наденька, Варенька и др.) включено в системный словарь имен собственных. В некоторых из предыдущих версий Word’а гипокористические (уменьшительно-ласкательные) имена Катя, Маша, Юля, Коля, Костя, Боря пропускались в текстах без подчеркиваний только потому, что спеллер считал их деепричастиями от глаголов «катить», «махать», «юлить», «колоть», «костить» и «бороть». Такие, как последние два, малоупотребительные глаголы остаются в системном словаре текстового редактора (см. также другие наши примеры в [3,273]). Однако новый Word’2013 уже включил эти уменьшительно-ласкательные формы в свой системный словарь имен собственных - это можно утверждать на том основании, что косвенные падежи (Катей, Машей, Юлей, Костю) пропускаются без замечаний, в то время как набранные строчными буквами «катей», «машей», «юлей», «костю» подчеркиваются красным. Однако без красного подчеркивания пропускаются «колей» (родительный падеж мн. ч. от «колея»), «коле» («о коле в дневнике»), «о боре» (предложный падеж слова «бор»), «борей» (северный ветер). Под влиянием западной моды некоторые наши вполне взрослые соотечественники, особенно женщины, стали представляться в СМИ своими уменьшительными именами. Эстрадные певицы часто обходятся без фамилии, но Пугачёву очень часто в СМИ именуют не Аллой, а Аллой Борисовной. В системном словаре Ворда-2013 имеются не только уменьшительные, но даже звательные формы личных имен. Сконструируем, например, фразы с ошибочным появлением пробела или дефиса внутри слова (похожие примеры мы приводили в работе [3,271]): «Кать, перестань хны кать!» или «Зин, сходи в мага-зин!». В этих предложениях с разбиением слов спеллер подчеркивает красным только «кать» и «зин» со строчной буквы. Еще пример: «Прош, Кеш, прош у, не тратьте кеш!». В этой фразе вставлен пробел в слово «прошу», поэтому «прош» со строчной буквы подчеркивается красным - в отличие от звательных форм имен Проша и Кеша. Но подчеркивается и форма «кеш» со строчной буквы - вопреки рекомендациям академических словарей. Разработчики спеллера правильным считают «популярное» написание «кэш». В Word’овском системном словаре имен собственных содержатся «неполные» имена Алексашка, Алекс, Саша, Саня, Санька, Шурочка, Шурик, Сашура, Манька, Муся, Анка и Анька, Нюша, Нюшка, Костик, даже Чук и Гек (герои повести Аркадия Гайдара). Этот список может быть продолжен. Приведем пример с достаточно распространенной опечаткой - пропуском буквы: «Шурка у зайца летом серая». Автокорректор-2013 эту фразу пропускает без замечаний - «благодаря» включению в системный словарь имени Шурка. Можно привести и другие примеры пропуска опечаток из-за включения в системный словарь некоторых уменьшительных имен: «Маши на времени», «Гек тары», Ксеня (Ксения). Еще пример специально придуманной фразы: «Луше ты у Михайло вой спроси!». Здесь допущены две опечатки: пропуск буквы «ч» и разбиение фамилии пробелом. Но у спеллера-2013 нет замечаний, так как в его системном словаре имеются имена Луша и Михайло. В вордовском системном словаре представлены также многие отчества и их варианты, например: Аркадьевич и Аркадиевич, Геннадьевна и Геннадиевна, Данилович и Даниилович, Самойлович и Самуилович, Фёдорович и Федорович. К сожалению, не все чиновники признают варианты написания некоторых имен (к примеру, Наталия и Наталья), отчеств и фамилий в разных документах тождественными, что доставляет немало хлопот их обладателям. Еще пример: Королёва и Королева - это одна и та же фамилия? Однако город Королёв не возбраняется писать и через «ё», и через «е». Если набрать «город Старая Купавна Московской области», то для подчеркнутого красным топонима «Купавна» подсказка-2013 среди других вариантов предлагает низкочастотное старинное русское женское имя Купава. Для подчеркнутых просторечных форм «Ильинишна», «Кузьминишна», «Фоминишна» и «Никитишна» подсказка-2013 среди прочих вариантов предлагает нормативное написание этих отчеств через букву «ч». Однако спеллер пока еще не находит в своих системных словарях отчеств с тем же осложненным суффиксом Лукинична и Саввична (а тем более «Лукинишна» и «Саввишна»), хотя имена Лука и Савва уже начинают опять входить в моду. Для сокращенной просторечной формы Васильич подсказка-2013 выдает среди других вариантов «Васильки» и «Вас Ильич», но полного варианта отчества не может предложить, так как имеющаяся в системном словаре официальная форма «Васильевич» длиннее на «целых две буквы» и спеллер не находит ее в системном словаре после попыток буквенных замен. А уж тем более не находятся просторечные стяженные формы Иваныч или Егорыч (но Палыч не подчеркивается - возможно, из-за присутствия этой формы в названии фирмы). Подобные просторечные отчества встречаются, например, в текстах художественной литературы - при передаче разговорной речи. В «Списке личных имен», приложении к академическому «Русскому орфографическому словарю» [4,936], даются следующие варианты отчеств: Вячеславович и Вячеславич, Вячеславовна и Вячеславна, Ярославовна и Ярославна (а также другие подобные пары от мужских имен, оканчивающихся на «слав»). Однако Word’2013 подчеркивает красной линией отчества Вячеславич, Вячеславна и почему-то Ярославовна, но не «Ярославна» (кстати, таким отчеством обозначена безымянная героиня «Слова о полку Игореве»). Для формы «Ярославовна» подсказка-2013 предлагает единственный вариант «исправления» этого отчества - разбиение «Ярослав овна». В словаре Зализняка читаем [1,739]: «<…> от данного имени отчества образуются по модели: Вячеславич, Вячеславна. Наряду с этим в официальных документах возможен также и не соответствующий реальному узусу искусственный вариант, построенный по общему правилу: Вячеславович, Вячеславовна». Наряду с нормативной формой отчества Никитич текстовый редактор Word’2013 пропускает без замечаний и иногда встречающийся вариант «Никитович», который отсутствует при имени Никита в «Списке личных имен» академического словаря РОС (см. [4,940]). Нет формы «Никитович» и в главе «Дополнительные особенности» приложения к словарю Зализняка, где к имени Никита тоже даны только Никитич и Никитична [1,740]. Владимира Ильича Ленина нередко называли просто «Ильич» (а царей часто называют только по имени, без фамилии и без отчества). При этом в советское время насаждалось исключение в склонении только его отчества, в отличие от других Ильичей. Требовалось писать «ИльичЁм» («ИльичЕм»). Но по правилам следует писать «ИльичОм», что и предлагается среди прочих вариантов исправления форм с «е» или «ё» подсказкой-2013. Под влиянием западной культуры в наши времена в СМИ отчества даже государственных деятелей и политиков не всегда упоминаются. В Word’овском системном словаре отсутствуют такие разговорные формы, как «Сергевна», «Тимофевна», «Патрикевна». Полная форма таких отчеств длиннее всего на одну букву. Пропуск буквы - довольно вероятная опечатка. Спеллер ее не обнаружит, если словарь текстового редактора будет содержать эти разговорные формы. Включать их в словарь целесообразно только тогда, когда система научится проверять вхождение отчества в трехкомпонентные образования ФИО или ИОФ: {имя, отчество, фамилия}. Имена собственные имеют свои особенности в склонении: «с князем МышкинЫм», но «знакомимся с городом Мышкином» (текстовый редактор Word’2013 не знает такого города и подчеркивает эту форму), «под городом Пушкином». В настоящее время есть город Пушкин (до 1918 г. Царское Село, с 1918 по 1937 - Детское Село) и город Пушкино Московской области. В словаре Зализняка [1,739] по поводу названий населенных пунктов на «ово», «ево» и «ино» читаем: «…очень часто встречается - как в устной речи, так и в печати - употребление данного слова как неизменяемого <…> Степень распространения этого явления так значительна, что, по-видимому, оно уже приближается к статусу допустимого варианта». То же самое можно сказать о фамилиях типа Шевченко (см. [1,739]), которые всё чаще уже не склоняются. Из словаря Зализняка [1,767] мы узнаем, что творительный падеж русской фамилии Чаплин (в этимологических словарях дается ее происхождение от слова цапля) - «ЧаплинЫм», но «с Чарли ЧаплинОм» (то же самое относится к фамилии Берлин - для соотечественника «ы», для иностранца «о»), а также что в творительном падеже должно быть «Игорем Северянином», а не «Северяниным». Неправильный вариант с прописной (заглавной) буквы и окончанием «ым» спеллером-2013 тоже пропускается - вопреки правилу склонения существительных северянин, крестьянин и т. п. Иван Петрович Пнин, родившийся в 1773 году, был внебрачным сыном князя Н. В. Репнина. В России второй половины XVIII века такие фамилии были нередки: Бецкой от Трубецкой, Агин от Елагин, Умянцев от Румянцев». В приложении к словарю Зализняка даны следующие (сибирские?) фамилии: Седых, Кручёных и Черных [1,779]. Указывается, что они не склоняются - и в мужском варианте тоже (таково исключение из правила). Имеются и другие особенности имен собственных. Можно, например, написать фразу о любви Павла Переца (а не «Павела Перца») к девушке ЛюбОви. Если набрать «Козаки, казаки и козаки», то слово с прописной буквы спеллером-2013 пропускается без замечаний, а последнее (устаревшее написание) со строчной буквы подчеркивается красным. То же самое произойдет с фразой «Волчек, сын Волчека и его волчек» (волчОк). Очевидно, что фамилии Козак и Волчек внесены в Word’овский системный словарь имен собственных. Приведем пример специально придуманной фразы - с пропуском буквы («й»): «Придется лопато копать». Здесь слово «лопато» подчеркивается красным как неопознанное. Однако фразу «Лопато придется копать» Word’2013 пропускает без замечаний. Причина - присутствие в системном словаре фамилии Лопато (смотрим в Википедии: «Георгий Павлович Лопато был главным конструктором первой ЭВМ, разработанной в СКБ завода им. Г. К. Орджоникидзе»). Если кто-нибудь из обладателей довольно распространенной фамилии Заец приобретет широкую известность в СМИ, то его фамилия, возможно, будет включена в системный список имен собственных текстового редактора. И тогда написание «Заец» (что, между прочим, предлагалось некоторыми лингвистами для упрощения правил) - в начале фразы, в заголовке или в качестве имени персонажа сказки - при компьютерной проверке текстов будет пропускаться без замечаний. Заключение. Из всего вышеизложенного можно сделать, в частности, следующий вывод. Желательно, чтобы в системных словарях выявлялись низкочастотные имена и фамилии, которые могут совпасть с искажениями в результате наиболее вероятных ошибок и опечаток достаточно употребительных словоформ, набранных с прописной буквы. Такие «подводные камни», которые при пока еще слабо разработанном анализе синтаксиса фраз препятствуют эффективному выявлению ошибок, можно либо убрать из системных словарей текстовых редакторов, либо снабжать особыми пометами - предупреждениями для пользователя.

Научные конференции

 

(c) Архив публикаций научного журнала. Полное или частичное копирование материалов сайта возможно только с письменного разрешения администрации, а также с указанием прямой активной ссылки на источник.