Архив статей журнала
В статье приведены результаты анализа приемов аргументации, реализуемых в текстах научной коммуникации. Под приемами понимаются повторяющиеся в корпусе текстов с разметкой аргументации отдельные типы аргументов и структуры, образуемые ими. Корпус содержит тексты трех жанров: научные статьи по лингвистике и информационным технологиям из научной электронной библиотеки CyberLeninka (https://cyberleninka. ru/), научно-популярные статьи с форума «Хабр» (habr. com/ru, далее ‒ статьи Habr), новости науки (poisknews. ru). Двойная разметка аргументации в текстах корпуса произведена на платформе ArgNetBank Studio пятью экспертами, специалистами в области теоретической и прикладной лингвистики. Вычисленные коэффициенты согласия между аннотаторами могут быть отнесены к разряду «существенное согласие». Моделирование аргументации соответствует стандарту Argument Interchange Format. Результатом разметки и объектом анализа являются построенные согласно стандарту графы аргументации с двумя типами вершин: информационными вершинами, содержащими аргументативные утверждения, и вершинами-схемами, определяющими для каждой связи между ними точную модель рассуждения из компендиума Уолтона. Исследуются графы, полученные из графов аргументации путем удаления всех информационных вершин и слияния входящей и выходящей дуг каждой исключенной информационной вершины в одну дугу (таким образом получаемые графы состоят только из вершин-схем), и подграфы таких графов. Частотный анализ подграфов, составляющих графы корпуса, проведен методом Frequent Subgraph Mining с учетом изоморфизма, выявляемого посредством реализации алгоритма Корделлы VF2 из библиотеки NetworkX. В результате выявлены приемы аргументации (повторяющиеся подграфы с числом вершин от 1 до 9), применяемые в текстах всех жанров (межжанровые), каждого отдельного жанра (межтекстовые), а также приемы, повторяющиеся в отдельных текстах (внутритекстовые). Установлено, что для научных статей корпуса характерны наибольшие устойчивость и разнообразие приемов аргументации, научно-популярные характеризуются активной полемической аргументацией, а приемы в научных новостях основаны на двух ключевых моделях, применяемых при компактной аргументации. Внутритекстовые приемы повторяют тенденции межтекстовых, тогда как приемы, встречающиеся в текстах всех жанров, редки. Совокупность приемов, используемых в тексте, образует применяемую в нем стратегию рассуждения. С целью выявления близких по стратегиям текстов проведена их кластеризация методами Ward и K-means. Построенные кластеры характеризуются однородностью текстов по жанру, а в кластерах с текстами одного жанра – по теме. Выявленные приемы аргументации, помимо классификации текстов, могут также применяться для оценки аргументативной составляющей текста, поиска убедительной аргументации, ее генерации и т. д. Работы по данной теме редко встречаются в исследованиях для текстов на английском языке, а для текстов на русском языке автоматический анализ закономерностей аргументации не проводился.
В статье представлен корпус текстов с аргументативной разметкой, относящихся к различным типам научной интернет-коммуникации. Разметка корпуса проведена на платформе ArgNetBank Studio. Обсуждаются жанры и функциональные характеристики текстов научной интернет-коммуникации. Сформулированы цель создания корпуса и принципы отбора включаемых в него данных, определены типы отбираемых текстов. Рассмотрены особенности аргументативной разметки научных и научно-популярных статей с комментариями, которые, в отличие от остальных типов включенных в корпус текстов, представляют собой интернет-диалоги. Это обусловливает специфику их аргументативной структуры. Обсуждается также проблема идентификации аргументативных схем, возникающая при разметке текстов разных типов. Проведенный пробный эксперимент показал, что для ряда пар схем выбор между ними затруднен. Предложено учесть сложности такого рода при разработке методики разметки, определив семантические различительные признаки схем аргументации. Данный подход проиллюстрирован на примере одной из рассмотренных пар схем. В ходе разметки аналитических текстов возникла необходимость добавления новых схем рассуждения и дополнения некоторых из уже имеющихся. В статье приведены формализованные описания таких схем и иллюстративные примеры из проанализированных текстов корпуса.