Dzen.ru Video Downloader

The easiest way to download Dzen.ru video, music, thumbnail without watermark or logo

ИСИ СО РАН

10 10 месяцев назад

Методологический семинар ИСИ СО РАН. Заседание №5

TIP! Right-click and select "Save link as..." to download.

Loading...
Докладчики: Серый Алексей Сергеевич, Чагина Полина Максимовна

Тема доклада: Создание датасетов для решения задач анализа аргументации на основе аннотированных текстов

Аннотация: Рассматривается задача автоматического анализа аргументации в текстах научной коммуникации. Под аргументацией понимается упорядоченная совокупность аргументов, используемых для подтверждения некоторого тезиса. Цель работы - экспериментальное исследование нейросетевых подходов к решению задачи поиска и извлечения аргументативных отношений между утверждениями, расположенными близко в тексте. Исследование проводилось на корпусе текстов ArgNet с аргументативной разметкой, созданной с помощью разработанной веб-платформы. Корпус включал тексты научных новостей, аналитические статьи с сайта Хабр, научные статьи и рецензии. На основе этих текстов построены наборы данных для машинного обучения. Для повышения качества обучения нейросетевых моделей наборы дополнены путём применения автоматических методов перефразирования и двойного перевода. Проведено исследование качества данных, полученных перефразированием, по нескольким ключевым параметрам: осмысленность в целом, а также смысловое и визуальное сходство с оригиналом. Рассмотрена роль индикаторов аргументации в задаче подготовки данных, и проведено статистическое исследование информативности индикаторов на подготовленном корпусе ArgNet. Рассмотрено два подхода к обучению моделей с маркированием индикаторов в текстах и с предварительным обучением языковой модели на задаче предсказания индикаторов.