Реферат: Смешение букв как причина возникновения ошибочных чтений в словарях
Реферат: Смешение букв как причина возникновения ошибочных чтений в словарях
В. В. Шаповал
1998
Мы
исходим из того, что "всякий печатный текст... мы можем рассматривать как
список произведения" и, подобно рукописному, он имеет свою индивидуальную
"историю создания" [Лихачев 1962: 430-431]. Именно отклонения от
рукописного или машинописного протографа в конечном счете приводят к появлению
в печатном тексте словаря лексических единиц, реальность которых требует особой
проверки. Если же верификация не проведена, то такие слова без должных на то
оснований начинают переходить из источника в источник и даже становятся
объектом историко-лексикологических и этимологических пассажей, иногда весьма
остроумных. Например, нигде пока не квалифицировано как цыганизм словосочетание
батенни грас жен 'приемщик краденых лошадей' [Потапов 1927: 12], отмеченное
среди многих сомнительных по степени освоенности цыганских вкраплений в словаре
криминального арго 1927 года [Шаповал, Дьячок 1997: 62-63]. На его месте
довольно надежно прочитывается цыганское (кэлдэрарское или шире влашское, или
еще шире южно-цыганское) *битинде грастен 'продавшие/продали лошадей' [ЦРС
1938: 16, 32; Цыг. кэлд. сл. 1990: 37, 54]. Это одно из тех случайных
вкраплений, которые, как справедливо заметил А.П.Баранников, "настолько
исковерканы, что трудно считать их постоянными компонентами арго"
[Баранников 1931: 158]. Понятно, что включать это словосочетание в арго русских
конокрадов на основании одной сомнительной фиксации и
"восстанавливать" 3 ударения батенни грас жен без предварительного
этимологического анализа довольно рискованно, ср.: [Грачев 1997: 14; 118].
Ошибки могут искажать не только заглавное слово, но и толкование. Даже
неоднократный повтор в словарях "арготизма" вудер 'зверь'
[Мильяненков 1992: 99; ББИ 1992: 49; Балдаев 1997-I: 74] не позволяет считать
это слово реально существующим. Цыганское вудэр значит 'дверь' [ЦРС 1938: 22,
137; Pott-II: 78]. А то, что в данном случае описано с ошибкой именно цыганское
слово, доказывается не только сходством написания и толкования, но также
косвенно и наличием в трех указанных источниках еще примерно 70 слов цыганского
происхождения, "списанных" с подобными неточностями (выявляемая
"стратегия цитирования" как серьезный довод в пользу единства
источника будет рассматриваться отдельно).
Минимальный
контекст, в котором возникает и выявляется смешение букв, это графическое слово
(группа букв между пробелами). Неверное чтение буквы вызывается плохим
качеством источника (небрежный почерк, нечеткая печать), но в обычной ситуации
трудности чтения преодолеваются благодаря контексту. Сохранение и преумножение
подобных ошибок в описании редких слов объясняется неузнаванием или незнанием
слова, а также тем, что контекст ограничен весьма короткой словарной статьей.
Словарная статья очень часть содержит лишь толкуемое слово и его толкование.
Рассматриваемый тип ошибок нередко сопровождается и ошибками в определении
границ малоизвестного слова. Ср. рассмотренное выше грастен > грас жен. Это
явление еще В.А.Богородицкий назвал "переразложением" на письме
[Богородицкий 1915: 169].
Многие
типы смешения букв в равной мере опасны для латиницы и для кириллицы. Так,
гапакс патикус 'пассивный гомосексуалист' у Флегона [Флегон 1973: 230], по
нашему мнению, является мнимым словом, возникшим в результате ошибочного чтения
латинского patiens 'страдающий, пациент' как paticus (смешение рукописных е n и
с u ). Затем это чтение было передано в русской транслитерации. В принципе
возникновение лексикографических мнимостей может быть связано с утратой
различия между латиницей и кириллицей, то есть с неверным распознанием
алфавита. Это редкий подтип ошибок прочтения. Например, якобы латинское calixrama
[Сомов 1996: 175] в объяснении происхождения полонизма келишка 'рюмка' следует
читать *calix - 'чаша'.
Виды
смешений букв классифицируются по ряду параметров. Так, представляется важным в
первую очередь отличать:
-
случаи смешения отдельных букв (г-ч: калганъ - калчанъ [Даль-I: XXXIV] [Cр.
сомнительный арготизм колчан 'голова' [Потапов 1927: С. 71], вместо калган, а
также: [Балдаев 1997-I: 195] и др.]),
-
и (условно говоря) ошибки межбуквенного переразложения, связанные с
произвольным установлением границ в группах букв, в результате которого
элементы по-новому перераспределяются между отдельными знаками. Например,
шубрейское метатка 'рубаха', весьма вероятно, возникло как неверное прочтение
слова манатка 'рубашка' [Добровольский 1897: 348]; смешение рукописного ет и ан
в результате объединения второго элемента буквы а с н, образовавших
трехэлементную букву т. Весьма характерный пример - смешение мо и лю. Проф. И.
Г. Добродомов на основе анализа контекста восстановил авторский спунеризм
мобимая люзоль вместо любимая мозоль у Н. С. Лескова [Добродомов 1993: 63-64];
ср. также ошибочно прочитанное рязанское слово пмогавить 'бездельничать,
шиканить, подличать' наряду с плюгавный 'бездельник, шикан, подлец, мерзавец' в
источнике 1820 года [Макаров 1820: 19]. Весьма близко к этим примерам стоит и
кашинское слово тайного языка жирлюпа '10 копеек' (т.е. 20 грошей - В.Ш.)
[Кашин 1820: 167] вместо *жирмаса? (с переразложением л ю п в м а с), ср.
тюркизм жирмас '20 рублей' и мн. др. производные [Дмитриев 1931: 172].
Собственно
типы смешений букв далее можно формально разделить на смешения одноэлементных
(г-ч-с-е-i--r), двухэлементных (п-н-и) и трехэлементных букв (ж-ш-т). Приведем
по одному примеру на каждый тип.
Наиболее
распространены смешения двухэлементных букв (п-н-и-й-а): банзан 'осужденные
японцы' [Балдаев 1997-I: 27]; вероятно, вместо банзай (японское приветствие
banzai, mansai, букв.: "пожелание 10 000 лет жизни"). Однако нельзя
полностью исключить и дистантную межслоговую ассимиляцию в просторечии.
Смешения
трехэлементных букв (т, ж, ш, щ) с большой вероятностью дополняются
результатами переразложения этих букв. Мы уже останавливались на истории
мнимого арготизма мента 'обратный ход, возврат' [Мильяненков 1992: 160; ББИ
1992: 140; Балдаев 1997-I: 228], возникшего в результате искажения формы и
толкования цыганизма менжа 'задний (про)ход' [Потапов 1927: 91], см.: [Шаповал,
Дьячок 1997: 62]. К тому же цыганскому слову (минджь ж., минджя мн. 'vulva')
восходит глагол менжеваться 'испытывать неуверенность' и, весьма вероятно,
причастие/прилагательное от него минесованный 'пугливый' [ТСУЖ 1991: 107],
представленное в дефектной записи (ес вместо ж).
Смешение
сходных по начертанию букв, опираясь на показания печатного текста, лишь
отчасти можно классифицировать по их природе, то есть определить: а) возникли
ли они в рукописи или в печатном тексте; б) применительно к машинописным и
печатным текстам определяется также вызваны ли ошибки сходством начертаний или
соседством на клавиатуре; в) и, наконец, применительно к печатным текстам
последнего времени можно также проводить различие между "очитками"
человека и неисправленными человеком "очитками" компьютера.
Ошибки,
возникшие в результате неверного чтения рукописи, иногда удается выявить по
печатному тексту на основе внутренней критики источника. Так, для шубрейского
васьминуса 'восемь' вероятнее принять чтение *васьминжа, поскольку другие
числительные в том же арго имеют криптолалический формант -жа: пинжа 'пять',
семинжа 'семь', девитинжа 'девять' [Добровольский 1897: 343]; здесь имело место
смешение рукописных ус и ж с удлиненной центральной мачтой. Этот вывод
позволяет иначе взглянуть на изолированное шубрейское абвагривать 'обвешивать'
[Добровольский 1897: 343], которое, возможно, следует читать *абваживать (от
вага 'вес'); смешение рукописного ж с удлиненной центральной мачтой и группы
гр.
В
ряде других случаев специфическое смешение букв указывает на неверное чтение
типографского или машинописного текста, например, з - в: безглавый
'беспаспортный' [ББИ 1992: 26; Балдаев 1997-I: 32] вместо более раннего
безглазый 'то же', см.: [Трахтенберг 1908: 6], а также ряд словарей последующих
лет. В рукописи же обычно смешение д и з (см. выше вудер с толкованием 'зверь',
вместо 'дверь').
Смешение
сходных по начертанию букв в машинописи и типографском тексте следует отличать
от специфических ошибок, связанных с расположением букв в наборной кассе,
клавиатуре линотипа, печатной машинки, вызванных тем, что рука случайно
попадает на соседнюю букву [Лихачев 1962: 431]. Таковы в арготических словарях:
дихик наряду с дизик 'дезертир' [СРВС-4: 75] в словаре 1964 года (х и з на
клавиатуре рядом); галте 'деньги' вместо гальё, гольё 'наличность' [ББИ 1992:
54; Балдаев 1997-I: 84] {В этих словарях галте сопровождается пометой
"ин[оязычное]", что следует понимать, вероятно, лишь как сигнал
непрозрачности этимологии слова для составителей, поскольку в другой публикации
по той же рукописи коррелирующая с "ин." помета
"международное" при слове галте отсутствует [Мильяненков 1992: 102]}
(т и ь соседствуют на клавиатуре); возможно, также и балячина 'сало' вместо
отмечаемого ранее балясина [Щербакова, Бруева 1994: 33] (соседство ч и с).
Смешение
сходных по начертанию букв при сканировании весьма непросто отличить от ошибок
иного происхождения. Мы предполагаем, что будда 'мужеложство' [Балдаев 1997-I:
48], появившееся на месте булда, бульда [ББИ 1992: 35], является ошибкой,
возникшей при сканировании. В принципе мы учитываем, что д и л соседствуют на
клавиатуре, но если бы указанная ошибка возникла при ручной перепечатке, то
были бы и другие ошибки "человеческой" природы, однако текст прежнего
издания воспроизведен стереотипно, буквально. Эта нечеловеческая
орфографическая цепкость (на фоне новых дополнений, написанных во 2-и издании
человеком явно далеким от литературного труда) делает наше предположение весьма
вероятным.
В
весьма тщательно выверенном издании, встретилась опечатка в заглавном слове
КЛЯТТОР 'монастырь', ср. пол. klasztor, укр. кляштор: "Но что засуетился
двор? Знать, дочки - панны милоглазы, Оставя скучный свой кляттор, Надели свадебный
убор?.." (Ф.Глинка. Набег запорожских казаков из Сечи на Волынь) [Редкие
сл. 1997: 192]. Опять же, как в предыдущем случае, ошибка могла быть вызвана
рядом причин: неверным выбором чтения источника начала 19 века (трехэлементное
строчное т), возникнуть при копировании рукописной картотеки, даже при чтении
курсива в промежуточных корректурах. Однако отсутствие других подобных
неточностей в корпусе словаря указывает на то, что человеческое участие в
данном случае было весьма квалифицированным. То есть, скорее всего, ошибка
возникла при рутинном копировании, автоматической трансформации уже вычитанного
текста.
Как
новый тип ошибок, очитки при сканировании требуют более детального разбора. В
качестве объекта анализа мы выбрали недавнее переиздание романов Агаты Кристи
[Кристи 1998]. В отличии от лексикографических источников это коммерческое
издание характеризуется известной небрежностью и поэтому идеально подходит для
ряда существенных обобщений. Вот некоторые примеры специфических сканерных
опечаток по алфавиту (страницы в скобках): смешение а - е: (я имею в виду) на
её. И не твою жену (259); смешение ав - на: Но иногда, завете, я очень
беспокоюсь... (505); смешение а - э: Вы рассказали об атом...(814, 724);
смешение е - с: грубоватый е виду (608); смешение ес - се: Вы не будете
возражать, сели я...(423); смешение ж - ш: Зловещ оскал и шуток зев пещеры...
(326); смешение зн - ок: он окал, что место считается красивым (261); смешение
ин - пи: несколько роз "Куин Элизабет" > несколько роз сорта
"Купи Элизабет" (716-717) ); смешение н - п: отель "Ройал
Спа" (26) > служащие "Сна" его не замечают... (54); смешение
о - с: И сна решительно добавила... (16) и мн. др. Даже приведенных примеров
достаточно, чтобы понять, что ошибки последнего типа таят в себе серьезную
опасность. Если речь идет о словах редких, необычных, то при автоматической
проверке орфографии именно правильные варианты слова будут подчеркнуты
компьютером: "Спа", "Куин". В то же время само наличие
орфографического контроля со стороны компьютера ослабляет внимание к
неотмеченным словам в тексте (завете, сна, купи, на, атом, шуток формально
являются правильными и не будут выделены компьютером, а то, что они стоят не на
своем месте, может определить только человек). Учитывая тот факт, что
компьютерная форма составления и хранения источников по русскому языку еще
только набирает силу [Рогожникова 1996: 203; Верещагин 1996: 214], приходится
ожидать появления целого ряда новых типов ошибок, прогнозирование и выявление
которых потребует дополнений к классической текстологии и источниковедению.
При
рассмотрении материала мы вынужденно ограничивались небольшим числом наиболее
ярких и поддающихся аргументированной квалификации ошибок, приведших к
появлению отдельных мнимых слов в словарях русского языка. Нашей задачей было
не исчерпывающее описание всех таких слов, выявленных в привлеченных к анализу
источниках, а пока лишь обоснование классификации ошибок, связанных с неверным
опознанием букв. Эту классификацию мы намереваемся использовать для
формирования рабочей системы "вопросов к тексту", то есть как
предварительную схему проверки сомнительных лексикографических данных на
графическом (побуквенном) уровне.
Список литературы
Трубачев
1964: Трубачев О. Н. Этимологические заметки, мелочи //Этимология. 1964. М.,
1964. С. 131.
Грачев
1997: Грачев М.А. Русское арго. Нижний Новгород, 1997. С. 11.
Лихачев
1962: Лихачев Д.C. Текстология. На материале русской литературы X - XVII вв.
М.-Л., 1962. С. 60.
Томашевский
1959: Томашевский В.Б. Писатель и книга. Очерк текстологии/ 2-е изд. М, 1959.
С. 47.
Богородицкий
1915: Богородицкий В.А. Лекции по общему языкознанию. Казань, 1915. С. 199-204.
Потапов
1927: Потапов C.М. Словарь жаргона преступников (блатная музыка). М., 1927. С.
12.
Шаповал,
Дьячок 1997: Шаповал В.В., Дьячок М.Т. О цыганизмах в русских арготических
словарях первой трети ХХ века //Русское слово. Материалы конференции.
Орехово-Зуево, 1997. С. 62-63.
ЦРС
1938: Цыганско-русский словарь. М., 1938. С. 16, 32.
Цыг.
кэлд. сл. 1990: Цыганско-русский и русско-цыганский словарь (кэлдэрарский
диалект). - М., 1990. С. 37, 54.
Баранников
1931: Баранников А.П. Цыганские элементы в русском воровском арго // Язык и
литература. T.
VII. Л., 1931. С. 158.
Мильяненков
1992: Мильяненков Л. А. По ту сторону закона. СПб., 1992. С. 99.
ББИ
1992: Cловарь тюремно-лагерно-блатного жаргона. Одинцово, 1992. С. 49.
Балдаев
1997-I/II: Балдаев Д.С. Словарь блатного воровского жаргона. В 2-х тт. М.,
1997. Т. I. С. 74.
Pott-I/II: Pott A.F. Die Zigeuner in Europa und Asien. Bd. 1-2.
Halle, 1845. Bd. II. S. 78.
Флегон
1973: Флегон А. За пределами русских словарей. London, [1973]. Р. 230.
Сомов
1996: Сомов В.П. Словарь редких и забытых слов. М., 1996. С. 175.
Даль
В.И. О русском словаре //Словарь живого великорусского языка. М., 1981. T. I. С. XXXIV.
Добровольский
1897: Добровольский В.Н. О дорогобужских мещанах и их шубрейском или курбацком
языке // Известия отд. русск. яз. и слов. Акад. наук. - СПб, 1897. - Т. II. -
Кн. 1-2. - С. 348.
Добродомов
1993: Добродомов И.Г. Наступить на любимую мозоль/ Русский язык в школе. 1993.
№ 1. С. 63-64.
Макаров
1820: Макаров Михайло. Краткая записка о некоторых простонародных словах
Рязанского, Пронского, Скопинского, Михайловского, Ряжского и Спасского уездов
Рязанской губернии, с объяснением их значения и с некоторыми замечаниями об их
обрядах, одежде и прочее //Труды Общества любителей российской словесности. Ч.
ХХ. Летопись, Ч. 5. М., 1820. С. 19.
Кашин
1920: Собрание особливых и отличающихся произношением слов, употребляемых между
жителями Тверской губернии. В городе Кашине и его уезде: с) Скрытые от прочих и
между одними торговцами того же города и уезда употребляемые названия денег,
счетов и других вещей//Труды Общества любителей российской словесности. Ч. ХХ.
Летопись, Ч. 5. М., 1820. С. 167.
Дмитриев
1931: Дмитриев Н.К. Турецкие элементы в русских арго // Язык и литература. T. VII. Л., 1931. С. 172.
Wolf.R: Wolf S.A. WOrterbuch des Rotwelsch. Deutsche
Gaunersprache. Mannheim, 1956. №
421.
ТСУЖ
1991: Толковый словарь уголовных жаргонов. М., 1991. С. 107.
Трахтенберг
1908: Трахтенберг В.Ф. Блатная музыка ("жаргон" тюрьмы). CПб., 1908.
С. 6, а также ряд словарей последующих лет.
СРВС
1983-I/IV: Козловский В. (сост.) Собрание русских воровских словарей. В 4-х тт.
T. 4. С. 75.