SCI Библиотека
SciNetwork библиотека — это централизованное хранилище научных материалов всего сообщества... ещё…
SciNetwork библиотека — это централизованное хранилище научных материалов всего сообщества... ещё…
В ходе онтогенеза дети учатся не только формулировать высказывания, но и самостоятельно исправлять свою речь, как это обычно делают взрослые во время разговора. Это помогает детям с течением времени стать более уверенными в себе и эффективными коммуникаторами. В статье представлены результаты изучения того, как дети самостоятельно корректируют свою речь в ходе телевизионного ток-шоу «Лучше всех!» Первого канала российского телевидения. Спонтанная речь в такой ситуации предполагает достаточно быстрый обмен репликами исходя из контекста и цели общения. Частью программы является интервью ведущего с ребенком, которое позволяет охарактеризовать личность героя передачи, создать связь с аудиторией и вызвать больший интерес к способностям ребенка. В исследовании, построенном на основе конверсационного анализа, рассматриваются различные виды самокоррекции (замены, повторы, добавления, обрывы), их функции, контекст и роль в диалоге. Полученные результаты свидетельствуют о том, что самоисправления являются как следствием трудностей при подборе лексики, так и отражением процесса поиска ребенком наиболее эффективного способа выражения мыслей. Кроме того, исследование показало, что различные проявления самокоррекции свойственны детям начиная с двух лет и сохраняются в дошкольном и младшем школьном возрасте.
In this research paper, I investigate the controlled text generation capabilities of ruGPT3Large through fine-tuning, specifically focusing on generating movie reviews based on a designated sentiment attribute. Controlled text generation is an active area of inquiry within the domain of Natural Language Processing, particularly for the Russian language. This study exemplifies a simple approach to controllable text generation by training ruGPT3 on a textual dataset containing sentiment-marked prompts, enabling the model to recognize patterns and generate analogous texts. The research provides a comprehensive analysis of the limitations, shortcomings and merits of fine-tuning a large language model using prompts embedded in a dataset. The generated texts exhibit coherence, logical structure, abundant coreferential links, and narratives and vocabularies characteristic of film reviews. Nevertheless, ruGPT3-generated reviews exhibit certain linguistic errors. I classify the most prevalent errors, such as named entity confusion, grammatical gender inconsistencies and sentiment fluctuations. Given that the primary objective is to evaluate the efficacy of basic fine-tuning with respect to the specified attribute, both automatic sentiment analysis and human evaluation are employed for output assessment. In comparing the outputs of the fine-tuned model and the baseline ruGPT3Large, I observe that positive sentiment generation is the most successful, while neutral and negative sentiments are produced by the models less accurately.
В статье рассматривается словарное представление пласта устаревшей лексики, известной в современном русском языке, в «Словаре русского языка XXI в.», на основе чего делаются выводы о месте лексико-семантических единиц прошлого в языке другой эпохи, семантических и стилистических процессах, характерных для функционирования устаревшей лексики в современном языке. Реализуется методика изучения лексики по лексикографическим данным, при которой толковый словарь современного языка, создаваемый по принципам антропоцентрической лексикографии, выступает и как итог описания национального языка, и как источник его изучения. Была подтверждена принципиальная неоднородность пласта устаревшей лексики в современном языке, по разным принципам строится лексикографическое описание историзмов и архаизмов разного типа. Обязательным элементом толкования историзмов является указание на время бытования обозначаемой ими реалии, толкование содержит элементы энциклопедизма. Ряд историзмов в современном употреблении развивает переносную семантику. Эти значения по возможности фиксируются Словарем, хотя естественно запаздывание лексикографической фиксации. Активным процессом современного этапа развития языка является актуализация историзмов, таким образом, в языке происходит регулярное перераспределение лексики между активным и пассивным запасом. В антропоцентрически ориентированном словаре актуализированные значения историзмов помещаются выше генетически первичных, но устаревших в современном языке. В словарных статьях, описывающих архаизмы, специальные пометы и подтолкования демонстрируют роль архаизмов как мощного стилистического ресурса. Отмечается использование архаизмов в стилизованной речи, в функции поэтизмов, с особой эмоционально-экспрессивной окраской, очень подробно описываются семантические нюансы и стилистические особенности таких употреблений. Подробная лексикографическая интерпретация устаревшей лексики в Словаре дает читателям словарей важную информацию о грамотном использовании этого пласта лексики и показывает преемственность языка разных эпох, являющуюся важнейшим свойством живой языковой системы.
In June 2022, the publishing house of Saint Petersburg State University published the monograph Communicative Adaptation in Dialogue: A phonetician’s point of view (Kachkovskaya 2022), the fruit of many years of work by a team of authors who are teachers, students and graduates of the Department of Phonetics and Methods of Teaching Foreign Languages. The book explores the manifestations of intra-speaker speech variability as a result of the adaptation of interlocutors to each other in the course of the process of communication. This is the first comprehensive study of the phonetic side of communicative adaptation based on Russian material that determines the relevance and innovative perspective of this work and its unconditional theoretical value. The subtitle of the publication (‘a phonetician’s point of view’) is of note and is able to arouse the interest of a prospective reader.
Современные средства компьютерной обработки текста позволили автоматизировать многие рутинные задачи лексикографов и терминологов. Помимо привычных программных средств, применяемых для вспомогательных задач прикладной лексикографии специалистами по составлению терминологических и других словарей, в решении таких задач может помочь язык программирования Python и его библиотеки, такие как NLTK (Natural Language Toolkit), pymorphy2, mystem и др. Python - один из самых распространенных и доступных в изучении языков программирования, который все шире применяется в прикладной лингвистике. Статья продолжает цикл публикаций, знакомящих практикующих лингвистов и лексикографов с Python и его возможностями для обработки текстов на естественном языке (natural language processing). Описываются техники, которые можно использовать для предварительной обработки текстов с целью последующего извлечения из них терминологии и составления терминологических словарей, в том числе для нужд письменного перевода. В настоящее время эта задача пересекается с использованием систем машинного перевода, в ряде которых реализована функция приоритетного использования пользовательского терминологического двуязычного словаря. Кроме того, некоторые из описанных приемов помогут извлечь информацию из больших корпусов текстов и проанализировать их содержание. В статье описывается порядок выполнения токенизации и лемматизации текста или корпуса текстов, приемы для выделения наиболее частотных лемм, рассматриваются разные подходы к поиску в тексте частотных словосочетаний методом нахождения n-грамм. Техники для автоматического нахождения потенциальных узкоспециальных терминов проиллюстрированы примерами из научно-технического текста. На материале художественного текста показаны методы анализа содержания, например, подсчет частотности определенных лемм в корпусе. Все приведенные примеры кода можно скопировать и запустить в облачной среде Google Colab без установки каких-либо программ на компьютер. Надеемся, что эти приемы облегчат повседневную работу лексикографов, а может быть, и побудят лингвистов к изучению языка Python.
Учебная направленность созданного в Санкт-Петербурге «Словаря редкой лексики по произведениям школьной программы» обеспечивается не только особенностями словника и характером семантизации слова в словарной статье, но и подготовленным методическим сопровождением, включающим систему заданий к словарным статьям и указаниями для учителя. Эта система опирается на словоцентрический подход в организации учебной работы и предполагает, во-первых, комментирование специально подобранных отрывков литературных произведений школьной программы в соответствии с лексикографическим описанием, а во-вторых, разноаспектный, а именно семантический, словообразовательный, грамматический, стилистический, анализ лексического материала, содержащегося в словаре. В числе приоритетных направлений предлагаемой учебной работы - сопоставительный анализ языковых явлений, формирование навыков обращения к авторитетным источникам информации о языке, в первую очередь к словарям разных типов и воспитание филологической культуры, предполагающей осознание взаимодействия узуса и нормы, исторической изменчивости как основополагающей характеристики языка, специфики эстетически значимого словоупотребления. Большое внимание уделяется также возможностям осуществления на предложенном материале исследовательской и проектной деятельности учащихся, организации публичного обсуждения теоретически значимых или практически актуальных языковых вопросов. Составленные задания предоставляют учителю возможность самостоятельно регулировать объем нагрузки на ученика и могут служить средством индивидуализации обучения. В статье приведены примеры заданий различных типов и методических комментариев к ним, адресованных учителю.
В связи с укреплением статуса английского языка как языка международного общения все более распространенным становится его изучение детьми раннего дошкольного возраста в условиях искусственно созданной языковой среды, которое до сих пор остается малоизученным в билингвальных регионах РФ. В данном небольшом социолингвистическом исследовании представлены результаты анализа речевых особенностей детей дошкольного возраста, проживающих на территории Республики Татарстан и осваивающих родные русский, татарский языки и неродной английский язык в условиях семейного взаимодействия. В данной работе проанализированы данные выборочного опроса, в котором приняли участие 28 казанских семей, воспитывающих детей от 2,5 до 7 лет, систематические записи речи детей, которые родители проводили на протяжении 4-х лет, а также аудио- и видеоматериалы (общий объем - 11 часов). Мы обнаружили взаимовлияние трех языковых систем на разных уровнях детской речи и проанализировали детские формообразовательные межъязыковые русско-английские и татаро-английские инновации, представляющие интерес в области онтобилингвологии и онтолингвистики. Также было установлено, что дети респондентов в процессе коммуникации на трех языках уже в раннем возрасте используют не только номинативную, но и металингвистическую функцию языка. Наше исследование подтверждает, что взаимопроникновение языковых структур в речи детей в рамках ныне популярного явления изучения и усвоения неродного английского языка детьми дошкольного возраста в условиях билингвальных регионов требует более серьезного и детального изучения специалистами по детской речи.
The article compares new foreign neologisms in the 19th and 21st century Hungarian and Russian dictionaries. Hence, not only two linguistic cultures, but also two historical periods come under scrutiny. To identify new loanwords, the corpora of major Russian and Hungarian dictionaries were compiled. The study analyses methods used in lexicographic description of new words in Hungarian and Russian dictionaries within the specified period. It also focuses on general observations made on specific linguistic material. A dictionary-based corpus (corpus in a square) proved to be effective in diachronic studies. It helped to reveal the main trends in lexical borrowing in two unrelated languages. Corpora provide data on the word origin from different time periods, the first inclusion of a lexical item, its origin, meaning, semantic evolution and thematic nearness, statistical data, etc. The scope of available data depends on the level of lexicographic description. It was found to be very different for the 19th and 21st century dictionaries with more extensive data provided by the latter. The study shows that corpora can be an important first step in linguistic research across a range of avenues.
When it comes to the development of society, digitalization appears to be one of its megatrends. Both on international and national levels, program acts are adopted to establish strategic areas of state policy, their principles, goals, objectives, and indicators. The world of work is also subject to digital transformation. That is why it becomes relevant to study the influence of state policy in the field of building an information society and digital economy development on the modernization of labor legislation. Three EAEU member states have been included in the subject of research: Russia, Belarus, and Kazakhstan. The methodology of work is based on a general scientific dialectical method of objective reality recognition. When conducting the research, general scientific logic techniques (analysis, synthesis, induction, deduction, the method of rising from the abstract to the concrete, etc.) and specific scientific methods of cognition (a legalistic approach, a legal historical method, and a comparative-legal analysis) were used. A special feature of the work’s methodology is the use of a political and legal approach. As a result of the conducted research, the following results have been obtained: on the number of amendments introduced into legislations of Russia, Belarus, and Kazakhstan over the years; on the total number of amended articles and new articles and chapters labor codes were supplemented with; on the political decisions made regarding the digitalization of labor, and on the content of legislative innovations. It has been established that each of the studied state pursues the state policy aimed at developing a digital economy and that during the researched period, some changes associated with regulating the use of digital technologies by addressees of labor law had occurred. However, the extents of state policy influence on improving labor legislation are different in these countries, just as their paths to modernization are unique. However, two areas of labor legislation digital transformation have been identified in all three countries. One of them is associated with remote work regulation, and the other - with regulating the electronic document flow in work relationships. In respect thereof, other promising areas for developing state policy and labor law in the context of global digitalization have been proposed: regulating the labor of platform workers, improving the system of rights guarantees for employees and employers in the field of employee training, protecting employees’ rights for personal privacy during their working activity, and regulating the use of the artificial intelligence system.
It should be noted that as a universal approach to international legal regulation of labor relations, the principle of effective child labor prohibition is one of four fundamentals in the field of labor to be applied by ILO member states on a mandatory basis regardless of ratification of any particular Conventions, but just subject to their adherence to the ILO Constitution. Although child labor is prohibited by regulatory acts and this is reflected in national policies and special programs of Eurasian Economic Union (EAEU) member states, child labor remains a problem that puts the basic rights of a significant number of children in jeopardy. The primary methods are system analysis and a comparative legal method of studying child labor issues in the Eurasian Economic Union member states in respect to the analysis of its current state and ensuring the effective implementation of a child labor prohibition in the Eurasian Economic Union. The issues of new institutional arrangements for protecting children’s rights in EAEU member states are analyzed in the paper. There is a particular focus on the lack of a special children’s rights protection authority (aside from Russia and Kazakhstan) and the trend of significantly weakened activities by labor inspections in EAEU member states in respect to implementing child labor prohibition as well. The need for defining the concepts of ‘light work’ and ‘labor education’ and their formalization in labor legislation provisions is stated in the paper along with the need to adopt legal norms disclosing the nature of relations arising from the work performed by children and the types of this work in the informal economic sector. It appears necessary to work out a concept for regulating relations in the field of child labor in the framework of strategies for the social and economic development of Eurasian Economic Union member states that shall provide for the elimination of child labor based on child labor legislation monitoring and the practice of its enforcement in these states.