Безалаберщина и лганье: какие слова пропали из русского лексикона за последний век
В качестве материала для исследования специалисты провели сравнительный анализ статей и комментариев современных блогеров на «Яндекс.Дзене» и дневниковые записи, сделанные с 1900 по 1940 год, из собрания центра «Прожито» при Европейском Университете в Санкт-Петербурге. В результате они сформировали два списка, в каждом из которых 1000 слов. Первый — со словами, частотность которых снизилась по крайней мере в десять раз за последний век, а второй — со словами-приобретениями русской лексики, которые ни разу не встретились в дневниковых записях первых сорока лет XX века или изменили контекст своего употребления позже.
Например, в дневниках, сделанных в период до Великой Отечественной войны, часто употребляется слово «воркотня», на смену которому пришли «болтовня» или «ворчание», а вместо расхожего сегодня «быстро» раньше чаще использовали «ходко». Или, например, «кликать», которое в первой половине ХХ века использовалось как синоним «звать», сейчас означает нажатие на кнопку компьютерной мыши.
Также на сайте исследования «Яндекса» сейчас можно найти список из ста уходящих и ушедших из русской лексики слов с примерами употребления и современными аналогами, примеры слов-приобретений и лексику, которая изменила основное значение. Некоторые слова просто изменили свое звучание: так «безалаберщина» стала «безалаберностью», «вздорожать» — «подорожать», а «до невероятия» сократилось до «невероятно». А другие вовсе исчезли из нашего лексикона: мы больше не говорим «безначалие» (отсутствие начальства), «вчуже» (со стороны), «захолонуть» (застыть) или актуальное в последние годы слово «инфлюэнца» (грипп).
Для поиска слов, у которых изменилось основное значение, аналитики проверяли, насколько изменился контекст их употребления. С помощью алгоритма word2vec они получили векторы связей слова с другими в каждом из двух корпусов — современных блогах и дневниках «Прожито», а потом нашли такие векторы, которых в сравниваемых корпусах сильно отличаются. Датасет, который содержит информацию, как менялся русский язык с первой половины XX века, по словам исследователей, может быть полезен для лингвистов, которые смогут использовать его данные в своих научных работах.
«Слова не только уходят, язык постоянно пополняется новыми словами. И дело не только в том, что появляются вещи, которые надо как-то называть (например, парковка, кроссовки, чипсы). Есть и такие слова, к которым мы давно привыкли, но которых всего сто лет назад еще не было в русском языке — во всяком случае, они не встречаются в текстах из корпуса «Прожито». Бывают и другие изменения: слово не уходит, но сильно меняет своё основное значение. Чтобы найти такие примеры, аналитики
«Яндекса» сравнивали лексические окружения каждого слова в двух корпусах — то есть проверяли, насколько изменился контекст его употребления», — комментирует Борис Иомдин, ученый
«Яндекса», заведующий сектором Института русского языка им. В. В. Виноградова РАН.