Формальное выделение приёмов и стратегий аргументации в текстах научной коммуникации

- -
- 100%
- +

© Иван Сергеевич Пименов, 2026
ISBN 978-5-0069-6329-0
Создано в интеллектуальной издательской системе Ridero
Введение
Настоящая работа посвящена проблеме формального анализа структур аргументации в текстах научной коммуникации (преимущественно коротких научных статьях) на русском языке методами компьютерной обработки. Такие структуры рассматриваются на уровне приёмов и стратегий аргументации. Приёмы соответствуют организованным, повторяющимся в разных текстах структурам из одной или более типовых моделей рассуждения (абстрактных логических схем, регулирующих построение аргументационных связей между высказываемыми утверждениями в процессе доказательства некоторой идеи). Совокупность приёмов, применяемых на уровне целостного полного текста для доказательства его ключевой идеи, образует стратегию аргументации, реализуемую автором этого текста. Полезно сразу отметить, что термин «доказательство» понимается в работе в широком смысле как поддержка одного тезиса другим в аргументационной структуре текста: расширенное толкование связано с моделированием аргументации в терминах аргументационных схем Дугласа Уолтона, где разные схемы (модели рассуждения) соответствуют разным видам обоснования в классическом понимании, от доказательств в строгом определении до логических ошибок (таких как ad hominem).
Формальный анализ прагматических языковых явлений, к числу которых относится аргументация, является фундаментальной лингвистической проблемой. Сложность аргументации как явления и теоретическая значимость её изучения иллюстрируются многоаспектностью аргументационных исследований в рамках различных дисциплин: как собственно лингвистики, теоретической и прикладной, так и риторики [Perelman, Olbrechts-Tyteca, 1969], философии [Van Eemeren, Grootendorst, 2004], формальной логики [Hintikka, 1989]. Задача формальной обработки аргументационных структур предполагает использование методов компьютерной лингвистики, в частности, направления Argument Mining, извлечения аргументов из текстов на естественном языке [Lawrence, Reed, 2019].
Анализ аргументационных структур в целостных текстах представляет интерес и для традиционной лингвистики ввиду многосторонней природы текста как продукта коммуникации, одновременно обращённого и к системе языка (средствами которой он образуется), и ко внеязыковой действительности (к которой относятся и связи между описываемыми в тексте явлениями), и к речемыслительной деятельности говорящего (отдельной языковой личности). Успешное решение обширного круга текстовых проблем требует развития междисциплинарного подхода, интегрирующего достижения различных наук: как собственно лингвистики, так и семиотики, психологии, герменевтики, стилистики, наконец, риторики [Бернацкая, 2009]. Важность риторики в изучении текста подчёркивается лингвориторической парадигмой, согласно которой специфика языковой личности (ЯЛ) в классическом представлении Юрия Николаевича Караулова (всех трёх её структурных уровней, вербально-семантического, лингво-когнитивного и мотивационного) проявляется наиболее полно в организации речи: в композиции логоса, пафоса и этоса (как мыслительного, эмоционального и нравственного оснований речи) на разных риторических этапах выражения мысли (инвенции, диспозиции, элокуции) [Ворожбитова, 2014]. Как отмечает сам Ю. Н. Караулов, главенствующую роль в иерархии уровней ЯЛ играет мотивационный уровень, на котором выражаются её коммуникативные потребности, а к числу трёх ключевых типов этих потребностей относится воздейственная: аргументация же по своей природе выражает специфику воздействия одной ЯЛ на другую в процессе общения, в связи с чем анализ применяемой аргументации значим для изучения ЯЛ в её культурном контексте (например, изучение семиотического обращения текстов в речевом воздействии, проверка, к каким именно текстам производятся отсылки разнообразных видов при обосновании тех или иных точек зрения, позволяет выявить прецедентные тексты культуры) [Караулов, 2010, С. 211—237]. Отдельно Ю. Н. Караулов акцентирует ключевые аспекты аргументации, обеспечивающие отражение в её акте отличительных характеристик соответствующей ЯЛ: диалогичность, адресованность (определённой личности или группе людей), субъективность (мотивированность частным интересом), а также её двойственная природа (реализация логической траектории языковыми средствами) [Караулов, 2010, С. 245—258]. Соответственно, значимость риторической перспективы в изучении текста как сложного целого, выстраиваемого по итогам речемыслительной деятельности в процессе коммуникации, влечёт актуальность исследования формальной организации текста на уровне реализованных, уже в нём материально представленных аргументационных структур (в рамках которых и отражается выражение логоса, пафоса и этоса).
Анализ аргументации как воздействия на мнение слушателя важен и в контексте исследования опосредованного языком социального взаимодействия в рамках лингвистического дискурс-анализа (в связи с антропоцентрическим фокусом современного языкознания) [Красина, 2018]. Исследования дискурса, в свою очередь, тесно связаны с лингвистикой текста, к ключевым проблемам которой относится изучение категорий связности и цельности текста [Минина, Карзунина, 2010] как двух его сторон, одновременно противопоставляемых и предполагающих друг друга (невозможности в тексте изолированных компонентов, не связанных с иными, при несводимости текста как образа ситуации к отдельным его компонентам) [Мурзин, Штерн, 1991, С. 11—18]. Одной из таких категорий выступает его аргументационная организация, которая может рассматриваться как один из аспектов связности текста, сочетающий логику изложения и композицию языковых средств, на уровне его макроструктуры [Негрышев, 2011] в классическом представлении Тео ван Дейка (как иерархического источника глобальной связности текста, или его семантического плана, регулирующего стратегию его представления на локальном и линейном уровне, например, в распределении эксплицитной и имплицитной информации, установлении локальной текстовой связности) [ван Дейк, 2000, С. 41—67]. В свою очередь, разработанные Т. А. ван Дейком и В. Кинчем концепции макроструктуры и макропропозиции удобно использовать для представления понятий аргументационной структуры текста и отдельного аргумента: аргумент, образованный системой отдельных утверждений (посылок и заключения), может быть соотнесён с макропропозицией как пропозицией, выводимой из ряда пропозиций в результате свёртывания их смысловой структуры, а роль отдельных аргументов в аргументационной структуре близка в данном ракурсе соответствующей роли макропропозиций в обеспечении глобальной связности текста на уровне его макроструктуры (с учётом того, что две данные пары понятий принадлежат разным теориям и, соответственно, разным терминологическим подсистемам).
В дополнение к основным категориям, общим для всех текстов, современными исследователями подчёркивается способность реальных текстов проявлять категории, обусловленные коммуникативной спецификой различных сфер деятельности, причём изучение таких ситуационных категорий необходимо для всестороннего представления текста [Иргашева, 2011]. Рассмотрение аргументации как текстовой категории обуславливается и распространённым мнением о её реализации исключительно на уровне целостных текстов в процессе коммуникации, без возможности ограничения аргументации традиционными языковыми единицами с предшествующих уровней языка [Филиппов, 2003, с. 270] (однако существует и точка зрения о принадлежности аргументационного компонента системе языка, выраженная, в частности, в теории «радикального аргументативизма» [Anscombre, Ducrot, 1989]). Анализ способов ведения дискуссии, изложения доказательств и убеждения слушателей в научной коммуникации представляет естественный интерес при исследовании научного дискурса, но также следует отметить его прикладное педагогическое применение для усовершенствования методик развития языковой личности [Архипова, 2005].
В свою очередь, выявление аргументационной специфики разных жанров научной коммуникации и исследование различительной способности приёмов аргументации в передаче жанровой специфики обретает особую значимость в контексте стилистики и конкретно проблемы разграничения и описания стилей, выявления связей между устойчивыми группировками текстов и изменчивыми наборами реализуемых в них языковых конструкций [Костомаров, 2005, С. 49—52]. Сведения об аргументационной организации текстов разных жанров, отражающей их смысловое структурирование в соответствии с прагматическими факторами в коммуникативной ситуации (ввиду направленности процесса убеждения на читателя), дополняют набор разноаспектных характеристик для типологизации текстов [Чаплина, 2009]. Типология текстов выступает одной из основных проблем лингвистики текста и даже выделяется в её самостоятельный раздел (по примеру лингвистической типологии языков) [Чернявская, 2009, С. 51—68]. Эта задача осложняется тем, что на характер текста влияют все его параметры в совокупности, в связи с чем научная типология текстов должна принимать во внимание признаки со всех уровней языковой системы (по аналогии с отмеченной типологией языков) [Левицкий, 2006, С. 202—205]. Анализ аргументационных структур в текстах научной коммуникации, направленных на доказательство излагаемых выводов, позволит оценить информативность показателей этого уровня в разграничении типов текстов.
Двуплановая природа аргументации (с одной стороны, как воздействие на мнение слушателя посредством доказательства некоторой идеи, с другой, как процесс достижения вывода путём построения логических связей в ходе мышления) обеспечивает её теоретическую актуальность в контексте обеих ключевых парадигм современной лингвистики: не только коммуникативной, но и когнитивной. Аргументационные структуры отражают мыслительные процессы, связанные с возникновением, языковой репрезентацией и передачей знания, которые находятся в фокусе внимания когнитологов [Кубрякова, 2012, с. 17]. Отдельное внимание когнитивной науки привлекает репрезентация знания в научной среде, специализирующейся на получении нового знания. В этом контексте исследуется как конструирование структур знания в научном дискурсе (в академическом, научно-популярном и научно-учебном типах) с учётом его прагматической специфики в организации сообщаемой информации для убеждения адресатов [Манерко, 2017], так и осмысление научной коммуникации субъектами науки из разных социальных групп [Белоусов, Гатаулин, Ерофеева, 2017]. Оба указанных аспекта проявляются в аргументационных структурах, анализируемых в представленной работе.
Соответственно, анализ формальных аргументационных структур в текстах научной коммуникации (в том числе в аспекте их компьютерной обработки) представляется актуальным в контексте широкого круга разделов фундаментальной лингвистики: прагматики, лингвистики текста, стилистики, типологии текстов и когнитивной лингвистики.
Однако ввиду сложности аргументации как языкового явления исследования по её компьютерной обработке активизировались сравнительно недавно (так, первая специализированная конференция по Argument Mining состоялась в 2014 г.). При этом такие работы обращены преимущественно к текстам на английском и других зарубежных языках [Lawrence, Reed, 2014]. Исследования по формальному анализу аргументации в текстах на русском языке представлены в ограниченном объёме, в частности, ввиду трудоёмкости создания корпусов с аргументационной разметкой текстов [Котельников, 2018]. Тем не менее, прикладная значимость компьютерной обработки аргументации обуславливает активную работу по созданию аргументационных корпусов русского языка в последние несколько лет: пример такого корпуса (содержащего сообщения в социальной сети) представлен в [Kotelnikov et al., 2022].
Таким образом, актуальность проведенного исследования проявляется в двух аспектах: теоретическом и методологическом. Теоретическая актуальность обуславливается важностью изучения формальной организации аргументации как явления прагматического языкового уровня в текстах на русском языке, в частности, в научных статьях (направленных на доказательство исследовательских выводов). Методологическая актуальность работы основывается на необходимости интеграции традиционных лингвистических подходов к изучению аргументации и методов компьютерной обработки текстов для формального анализа структур доказательства и рассуждения с учётом языковой и жанровой специфики текстов научной коммуникации на русском языке. При этом лингвистическая сложность аргументации как прагматического явления обуславливает потребность в развитии и адаптации методов компьютерной обработки текстов, преимущественно применяемых для анализа более простых единиц иных языковых уровней (морфологического, лексического, синтаксического). Соответственно, моделирование и формальный анализ аргументационных структур обеспечивают возможность для расширения методологического аппарата лингвистики в целом.
Степень разработанности проблемы исследования. Ввиду сложности аргументации как языкового явления исследования по её компьютерной обработке (Argument Mining) образовали отдельное целостное направление с устоявшимся методологическим аппаратом сравнительно недавно (первая специализированная конференция по Argument Mining состоялась в 2014 г. [Lawrence, Reed, 2014]). Исследования в этом направлении обращены в основном к текстам на английском языке и таким жанрам, как юридические диспуты [Walker, Vazirova, Sanford, 2014], новостные статьи [Wachsmuth et al., 2018], политические дебаты [Lindahl, Borin, Rouces, 2019], онлайн-дискуссии [Hidey, McKeown, 2018]. Тем не менее, отдельные работы посвящены анализу аргументации в научных статьях, примером чего является статья [Green, 2015].
Исследования по компьютерной обработке аргументов в текстах на русском языке представлены в ограниченном количестве из-за недостаточного объёма доступных корпусов, как указано в [Котельников, 2018]. Впрочем, значимость темы обуславливает активную разработку аргументационных корпусов русского языка в последнее время: посредством перевода иноязычных корпусов [Fishcheva, Kotelnikov, 2019], через разметку научно-популярных статей [Сидорова и др., 2020] либо сообщений в социальных сетях [Kotelnikov et al., 2022]. Хотя научные статьи на русском языке ранее не становились объектом компьютерного анализа аргументации, известны исследования научно-популярных текстов, например, [Ким, Ильина, 2020], [Саломатина и др., 2020], [Zagorulko et al., 2020], [Ильина, 2023].
Объект проведенного исследования – аргументационные структуры в текстах научной коммуникации на русском языке (преимущественно научных статьях). Предметом исследования являются средства формальной организации элементов аргументации (утверждений, объединяющих их связей, типовых моделей рассуждения в основе этих связей) при доказательстве основной идеи целостного текста, обеспечивающей его смысловую связность.
Основная гипотеза исследования: формальный анализ аргументационных структур посредством интеграции сведений об их лингвистическом выражении (языковом оформлении утверждений) и их абстрактной логической организации (на уровне типовых моделей рассуждения в основе связей между утверждениями) позволяет выявлять составные приёмы и стратегии аргументации, характеризующие специфику доказательств в отдельных целостных текстах. На Рис. 1 показан пример искомого составного приёма: прямоугольные блоки содержат утверждения из конкретных текстов, овальные указывают на типовые абстрактные модели (схемы аргументации, элементарные приёмы), реализуемые при обосновании одних утверждений другими. Содержание утверждений различается между разными текстами (слева и справа), тогда как модели в связях между утверждениями совпадают. Одинаковы и их конфигурации в образуемой структуре из трёх элементарных приёмов, и эта структура соответствует составному приёму аргументации.

Рисунок 1 – Пример реализации составного приёма аргументации
В соответствии с основной гипотезой цель работы может быть сформулирована следующим образом: разработать и экспериментально проверить систему методов формального анализа аргументации в текстах научной коммуникации для распознавания и характеризации специфики доказательств в отдельных текстах на уровне как их языкового оформления, так и структурной организации. Под экспериментом в работе понимается практическое использование разработанных методов для компьютерной обработки текстовых данных из используемого корпуса с последующей оценкой эффективности методов на уровне как количественных показателей, так и содержательной интерпретации результатов их применения.
Достижение поставленной цели предполагает решение следующих задач:
1. Определить теоретические основы для формального представления аргументации с учётом как традиционных лингвистических подходов к её анализу, так и специфики методов компьютерной обработки текстов.
2. Подготовить корпус текстов (научных статей на русском языке) с многоаспектной аргументационной разметкой (согласно обозначенным теоретическим принципам, причём под многоаспектностью понимается характеризация аргументации на уровнях утверждений, связей между ними, типовых семантических моделей в основе этих связей) для подготовки и проверки компьютерных методов обработки аргументации, выраженной на естественном языке. Создание корпуса предполагает разработку методологии многоаспектной разметки аргументации в научных статьях, которая повысит согласованность разметки текстов разными аннотаторами.
3. Реализовать набор методов компьютерного анализа аргументационных структур, где отдельные методы предназначены для решения следующих подзадач:
3.1. распознавания предложений, содержащих аргументацию, связей между этими предложениями и отдельных частотных элементарных приёмов (экспертная разметка используется для машинного обучения классификаторов, применяемых для распознавания, и автоматической проверки качества их работы);
3.2. выявления элементарных и составных приёмов аргументации из размеченных текстов с учётом их жанровой специфики в многожанровой коллекции;
3.3. обобщения цепочек рассуждения согласно функциональной близости образующих их моделей рассуждения;
3.4. оценки аргументов по выраженности методов убеждения;
3.5. распознавания элементов методов убеждения (пафос, этос) в аргументах из неразмеченных текстов;
3.6. выявления текстов со схожей организацией аргументации и ранжирования их по сложности рассуждений путём интеграции сведений об их аргументационной специфике во всех отмеченных выше аспектах;
3.7. жанровой классификации текстов на основе сведений о реализованных в них приёмах аргументации.
4. Экспериментально проверить реализованные методы на подготовленном корпусе текстов, интерпретировать результаты и обозначить особенности построения аргументации в текстах научной коммуникации на русском языке.
Материалом исследования выступает корпус из 11495 тезисов и 10123 аргументов, образующих структуры аргументации для 100 научных статей с ручной разметкой аргументации тремя экспертами (для каждого текста подготовлено по две версии разметки независимо двумя экспертами). Размеченные статьи принадлежат направлениям лингвистики и информационных технологий (по 50 статей обеих тематик), характеризуются объёмом от 800 до 2000 слов (без учёта аннотаций и библиографических списков). Публикация анализируемых статей в научных изданиях указывает на достижение ими академического уровня, достаточного для прохождения рецензирования. Разметка корпуса проведена по ходу исследования, в связи с чем на отдельных этапах задействованы ранние версии корпуса меньшего объёма. На отдельных этапах исследования (при анализе аргументации в текстах разных жанров) привлекаются данные из параллельно размечавшихся корпусов научных новостей и научно-популярных текстов.
Разметка аргументации проведена в соответствии со стандартом AIF [Rahwan, Reed, 2009] и классификацией типовых моделей рассуждения (схем аргументации) за авторством Дугласа Уолтона [Walton, Reed, Macagno, 2008]. Разметка проведена на трёх уровнях аргументации: выявление утверждений (высказываний с аргументацией, принадлежащих целостной структуре рассуждений в тексте), распознавание связей между утверждениями (что включает определение их ролей как посылок либо заключений в составе аргументов), указание типовых моделей рассуждения из заданного набора для связей (с помощью моделей, также называемых схемами, уточняется семантика перехода от посылок к заключению). Корпусы с разметкой доступны на платформе ArgNetBank Studio [Сидорова и др., 2020], аннотирование текстов осуществлено с помощью инструментов этой платформы.
Для оценки надёжности разметки проведён подсчёт количественных коэффициентов согласия аннотаторов на разных этапах создания корпуса. Использован разработанный в ходе согласия специализированный коэффициент аргументационного согласия (КАС), учитывающий многоуровневую специфику разметки аргументации, а также два универсальных коэффициента с учётом случайного согласия между разметчиками, каппа Коэна и альфа Криппендорфа. Значения коэффициентов подсчитаны для каждого уровня разметки (выявление утверждений, связей, схем, в том числе на уровне групп функционально близких схем). Полученные значения близки известным значениям согласия при разметке аргументации на материале английского языка.
Для решения поставленных задач на базе указанных материалов исследования применены методологические подходы разных групп:
1. анализа аргументации на основе дискурсивного подхода (выявление аргументов с учётом, во-первых, лексико-грамматических маркеров и особых синтаксических конструкций для представления рассуждений, во-вторых, абстрактных логических моделей их организации, в-третьих, контекста реализации аргументов в целостной структуре рассуждений полного текста);
2. корпусной лингвистики (создание аргументационных корпусов, методики разметки, разметка текстов, оценка согласия аннотаторов);
3. обработки естественного языка (морфологический анализ, построение поисковых шаблонов для маркеров аргументации);
4. машинного обучения (классификация и кластеризация текстов и их элементов, извлечение аргументации).
Теоретическая (источниковая) база исследования включает работы двух групп. Одну представляют труды по исследованиям и моделированию аргументации с позиций различных дисциплин: в первую очередь, на основе лингвистических подходов, но также и в рамках иных направлений (философии, риторики, формальной логики). Другую группу составляют работы по компьютерной обработке текстов на естественном языке (как в рамках специализированных исследований аргументации, так и для общих смежных задач, таких как автоматическая классификация текстов) и фундаментальные труды по анализу данных разных типов (например, работы с описанием алгоритмов кластеризации, применимых как к текстовым, так и иным данным).
Глава 1. Теоретические основы представления аргументации
Первая глава представленной работы обращена к проблеме определения теоретических оснований для моделирования и анализа аргументации, выражаемой средствами естественного языка. Рассматриваются две группы подходов к аргументационным исследованиям: традиционные лингвистические и формальные.
Первый раздел Главы 1 направлен на сопоставление различных лингвистических подходов к изучению аргументации. В пункте 1.1.1 рассматривается общая классификация взглядов на соотношение системы языка и аргументационных структур. В пунктах 1.1.2, 1.1.3, 1.1.4 представлены отдельные подходы к анализу аргументации с лингвистической точки зрения: теория семантических блоков Марион Карел (расширение радикального аргументативизма Жан-Клод Анскомбра и Освальда Дюкро), лингвокультурологическое моделирование аргументационной семантики Эддо Риготти и Андреа Роччи, социо-дискурсивная концепция Рут Амосси (на основе естественной логики Жан-Блез Гриза). Особое внимание в пункте 1.1.5 обращено к развитию аргументационной теории в отечественных исследованиях (от работ по «языку революции» до когнитивной модели Анатолия Николаевича Баранова и современного подхода Евгении Рафаэлевны Иоанесян).
Во втором разделе Главы 1 представлен обзор формальных средств для моделирования аргументации. Пункт 1.2.1 содержит описание модели Стивена Тулмина, позволяющей обозначать детализированный состав отдельных аргументов. В пункте 1.2.2 рассматривается теория риторической структуры за авторством Уильяма Манна и Сандры Томпсон (как ранее разработанная лингвистическая модель для анализа риторической связности текстов, потенциально применимая и к аргументационным отношениям). В пункте 1.2.3 описывается специальный формат для записи именно аргументационных структур (Argument Interchange Format). Этот формат поддерживает моделирование аргументации в соответствии с семантической теорией аргументационных схем Дугласа Уолтона, которая в настоящей работе охарактеризована в пункте 1.2.4.



