SCI Библиотека

SciNetwork библиотека — это централизованное хранилище... ещё…

Результаты поиска: 214 док. (сбросить фильтры)
Статья: Автоматическая саммаризация родительских чатов в WhatsApp

Автоматическая саммаризация текста – одна из ключевых задач NLP, предполагающая создание краткой версии исходного текста. В современном мире, где объемы потребляемой человеком информации неустанно растут, задаче саммаризации уделяется все больше внимания. Автореферирование предполагает два основных подхода: экстрактивный и абстрактивный. Последний заключается в автоматическом создании саммари текста, в котором могут содержаться слова и предложения, не встречающиеся в источнике. Этот подход зачастую требует использования нейросетевых моделей, и для его реализации необходимы большие наборы специальным образом размеченных данных. Несмотря на значительные успехи в абстрактивной саммаризации публицистических и научных текстов, методы и датасеты, используемые для работы с монологическими документами, не всегда применимы для саммаризации диалогов. Кроме того, хотя создано достаточно много англоязычных датасетов для саммаризации текстов различных доменов, существующие наборы данных для автоматического аннотирования текстов на русском языке пока немногочисленны. Настоящая статья посвящена разработке и описанию русскоязычного диалогового датасета для саммаризации сообщений в родительских чатах и последующему обучению модели абстрактивной саммаризации для русского языка на авторском наборе диалоговых данных. В качестве материала выступил родительский чат с учителем в мессенджере WhatsApp. Процесс ручной разметки датасета включал в себя разбиение всех сообщений чата на отдельные диалоги, создание саммари и присвоение тематических меток для каждого разговора. В результате был создан датасет, содержащий 616 диалогов, в общей сложности состоящих из 3380 сообщений. Для файн-тьюнинга были выбраны модели-трансформеры ruT5, mT5 и RuGPT (ruT5 и RuGPT были предварительно обучены на русскоязычном датасете для автоматической саммаризации новостей), а для оценки их качества – метрики ROUGE-1, ROUGE-2, ROUGE-L, BLEU и BERTScore. В результате модели ruT5, дообученной на авторском датасете, удалось превзойти бейзлайн по всем пяти метрикам.

Формат документа: pdf
Год публикации: 2025
Кол-во страниц: 1
Загрузил(а): Дмитриева Кристина
Язык(и): Русский, Английский
Доступ: Всем
Статья: ОПТИМИЗАЦИЯ ПРОЦЕССА ТЕСТИРОВАНИЯ НА ПРОНИКНОВЕНИЕ В АСУ ТЕХНОЛОГИЧЕСКИМИ ПРОЦЕССАМИ С ИСПОЛЬЗОВАНИЕМ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ

Темой работы является исследование процесса широкого внедрения автоматизированных информационно-управляющих систем в промышленности, энергетике и на транспорте. Отмечается, что повышение их сложности неизбежно приводит к возникновению различного рода уязвимостей в этих системах, наличие которых позволяет злоумышленникам проникать в автоматизированные управляющие системы, брать их под свой контроль, а также нарушать нормальный режим работы управляемых ими технологических процессов. Подчеркивается, что в течение последнего десятилетия успешные кибератаки были зафиксированы в энергетике, в том числе атомной, в морском судоходстве, в портовых перегрузочных комплексах, а также в других системах. Превентивный подход к обеспечению безопасности автоматизированных управляющих систем заключается в выявлении и использовании существующих уязвимостей путем имитации возможных кибератак. Отмечается, что автоматизация такого достаточно трудоемкого процесса, как «тестирование на проникновение», позволяет сократить время, финансовые затраты и другие ресурсы. Исследованы основные методы выявления уязвимостей, в том числе с применением искусственного интеллекта. В представленном подходе к оптимизации процесса тестирования на проникновение в автоматизированные системы управления технологическими процессами использованы алгоритмы машинного обучения. Предпочтение отдано машинному обучению с подкреплением, основу которого составляет алгоритм Deep Q-learning. Предлагается интеграция методов сканирования сети, построения графа атак и обучения нейронных сетей для эффективного выявления уязвимостей и рисков в сетевых инфраструктурах. Для построения графа атак используются базы знаний MITRE ATT&CK с применением GBVA Framework, для выбора оптимальных действий в процессе тестирования - алгоритм Deep Q-learning.

Формат документа: pdf
Год публикации: 2024
Кол-во страниц: 1
Загрузил(а): НЫРКОВ АНАТОЛИЙ
Язык(и): Русский
Доступ: Всем
Статья: Опыт анализа социального самочувствия горожан: соотнесение характеристик городской инфраструктуры здоровья и тональности текстов из социальных сетей (на примере Санкт-Петербурга)

В статье описаны результаты исследования социального настроения горожан на основе текстовых данных из социальной сети ВКонтакте. Объект исследования – город Санкт-Петербург. Предлагаемый метод предполагает сопоставление тональности дискуссий пользователей социальных медиа с количественными данными, описывающими инфраструктуру города. Такое сопоставление возможно благодаря тому, что текстовые данные могут быть привязаны к району. Целью исследования было проанализировать возможности предлагаемого подхода, поэтому в качестве количественных данных взяты датасеты, описывающие инфраструктуру города по маркеру «поддержание здоровья»: количество поликлиник, больниц, площадок для занятия спортом. В статье описываются подходы к анализу тональности специфических текстовых данных (приводятся метрики качества используемых моделей), обосновывается актуальность связывания подобного рода данных с количественными показателями (статистиками, участвующими традиционно в методиках оценки благополучия городской среды). В работе продемонстрированы итоговые прикладные результаты: данные исследования нанесены на карту города.

Формат документа: pdf
Год публикации: 2024
Кол-во страниц: 1
Загрузил(а): Чижик Анна
Язык(и): Русский, Английский
Доступ: Всем
Статья: ОПРЕДЕЛЕНИЕ МЕСТОПОЛОЖЕНИЯ СУДНА ПО ГЛУБИНАМ ПРИ ПОМОЩИ НЕЙРОННОЙ СЕТИ

Предложен метод определения места судна по глубинам на основе нейронной сети, которая принимает на вход последовательность глубин, измеренных при помощи эхолота, а прогнозирует широту и долготу судна на момент измерения последней глубины. Нейронная сеть имеет архитектуру сети прямого распространения с несколькими скрытыми слоями и полными связями, удовлетворяющую условиям универсальной аппроксимации в соответствии с теоремой Стоуна - Вейерштрасса. Для обучения используется алгоритм Adamax при условии контроля наибольшего значения модуля невязки на каждой итерации. Моделирование выполнялось с использованием языка программирования Python и библиотеки Tensorflow. Модельная поверхность рельефа дна была представлена в виде многочлена второго порядка. Образцы получены на основе виртуальных измерений глубин в узлах координатной сетки с пространственным разрешением не хуже, чем один кабельтов. После сбора образцов выполнялось обучение нейронной сети, в ходе которого не использовалась контрольная выборка. В обучении участвовало несколько нейронных сетей, отличающихся количеством скрытых слоев, а также количеством нейронов в них. После обучения было проведено тестирование, которое предполагало движение судна вдоль меридианов, в точности не совпадающих с используемыми для формирования обучающей выборки. При этом наряду с вариантом средних по долготе меридианов рассмотрен вариант выбора меридианов с использованием датчика случайных чисел равномерного распределения. В результате тестирования все рассмотренные сети показали примерно одинаковую приемлемую навигационную точность, близкую к точности, полученной на обучающей выборке.

Формат документа: pdf
Год публикации: 2024
Кол-во страниц: 1
Загрузил(а): ДЕРЯБИН ВИКТОР
Язык(и): Русский
Доступ: Всем
Статья: ОПРЕДЕЛЕНИЕ ШИРОТЫ МЕСТА СУДНА ПО ГЛУБИНАМ НА ОСНОВЕ НЕЙРОННОЙ СЕТИ

Предложен метод определения широты места судна по глубине на основе нейронной сети, которая принимает на вход последовательность глубин, измеренных при помощи однолучевого эхолота и прогнозирует широту на момент измерения последней глубины. Сеть имеет два слоя. Первый слой содержит нейроны с функциями активации в виде гиперболического тангенса, второй состоит из одного нейрона, обладающего тождественной функцией активации. Набор учебных данных состоит из обучающей и контрольной выборок. Обучающая выборка формируется на основе слоя глубин, содержащегося в электронной навигационной карте. Контрольная выборка формируется путем псевдослучайных вариаций входных образцов из обучающей выборки. Каждая такая вариация соответствует постоянному изменению уровня моря вследствие ошибок измерений и/или колебаний ветрового и/или приливоотливного характера. Обучается сеть методом Adamax. Критерием эффективности обучения служит наибольшее значение модуля ошибки прогноза широты, определенное для образцов из контрольной выборки. После обучения сеть проходит тестирование на образцах, полученных аналогичным образом, как для контрольной выборки. Моделирование выполнено с использованием языка программирования Python. Для обучения и реализации работы нейронной сети используется библиотека TensorFlow. Моделирование выполнено для нескольких вариантов архитектуры сети, каждый из которых отличается количеством нейронов в скрытом слое. В результате было зафиксировано, что нейронные сети имеют тенденцию к обучению их прогнозированию широты места судна по последовательности глубин, что позволяет рассматривать их в качестве перспективного инструмента для решения задач батиметрической навигации.

Формат документа: pdf
Год публикации: 2025
Кол-во страниц: 1
Загрузил(а): ДЕРЯБИН ВИКТОР
Язык(и): Русский
Доступ: Всем
Статья: Применение искусственного интеллекта в сфере финансов на основе анализа международного опыта

Внедрение систем искусственного интеллекта в финансовую сферу вносит революционные изменения в способы анализа, предоставления информации и управления ею. Машинное обучение – разновидность искусственного интеллекта, которая позволяет ему автономно обучаться и совершенствоваться. В отличие от методов традиционного «жесткого» программирования, машинное обучение использует нейронные сети и глубокое обучение для работы с большими объемами данных для выявления закономерностей и аномалий. Гипотеза работы состоит в том, что для финансовой сферы характерны собственные способы применения ИИ, опирающиеся на наиболее распространенные, но отличающиеся от них варианты. Целью настоящей работы является систематизация способов применения моделей искусственного интеллекта в финансовых учреждениях в разрезе структурных подразделений. Применение искусственного интеллекта позволяет финансовым учреждениям создавать модели, направленные на решение конкретных проблем в условиях постоянно обновляющейся информационной среды. В соответствии с поставленной целью, в данной работе рассматриваются следующие аспекты: общее описание задач, решаемых ИИ, преимущества и недостатки применения ИИ; характеристика распространенности систем искусственного интеллекта в финансовой сфере; характеристика области применения искусственного интеллекта в финансовой сфере. Для выполнения работы автор использовал методы синтеза информации, анализа источников, классификации, сравнительного анализа.

Формат документа: pdf
Год публикации: 2025
Кол-во страниц: 1
Загрузил(а): Китинов Мигмер
Язык(и): Русский, Английский
Доступ: Всем
Статья: РАЗРАБОТКА КОМПЛЕКСА НЕЙРОННЫХ СЕТЕЙ ДЛЯ РАСЧЕТА ВЯЗКОСТИ ХИМИЧЕСКОЙ СМЕСИ НА ОСНОВЕ ДЕКОМПОЗИЦИИ ЗАДАЧИ

Представленная разработка способствует внедрению цифровых технологий в описание процессов нефтехимических предприятий, отвечает потребностям промышленности в быстрых и точных расчетах, сокращает зависимость от дорогостоящих экспериментов и зарубежного программного обеспечения, что делает его актуальным как для науки, так и для реального сектора экономики. Целью исследования является способ расчета вязкости широкой фракции углеводородов с использованием нейронных сетей для повышения точности и эффективности прогнозирования по сравнению с традиционными методами и реализация в виде специализированного программного комплекса. Для оптимизации процесса обучения и ускорения вычислений исходная задача была разделена на несколько более простых подзадач с уменьшенной размерностью параметров, предложенная декомпозиция значительно сократила объем вычислений, что способствует снижению параметричности построенного многослойного полносвязного персептрона и понижению проблематичности процедуры обучения моделей. Для автоматизации сбора информации для обучения многослойного полносвязного персептрона был разработан вспомогательный программный комплекс, формирующий требуемые наборы данных в Unisim. Все построенные нейронные сети обучались на выборках, которые разбивались на обучающее, валидационное и тестовое подмножества по 70, 15 и 15 % от исходного набора соответственно. Потери при обучении не превысили 10-6 при отсутствии переобучения. Работоспособность полученного многослойного полносвязного персептрона дополнительно проверили на производственных данных, не использовавшихся при обучении. Реализация метода осуществлена в виде оригинального специализированного программного комплекса, в котором используется согласованная работа нескольких обученных нейронных сетей для точного расчета вязкости углеводородных смесей. Разработанный программный комплекс доказал свою эффективность и надежность, представляя собой мощный инструмент для расчета вязкости широкой фракции углеводородов при моделировании процессов нефтехимии.

Формат документа: pdf
Год публикации: 2025
Кол-во страниц: 1
Загрузил(а): Лаптева Татьяна
Язык(и): Русский, Английский
Доступ: Всем
Статья: ПРИМЕНЕНИЕ МАШИННОГО ОБУЧЕНИЯ НА ГРАФАХ ДЛЯ ПОСТРОЕНИЯ РЕКОМЕНДАТЕЛЬНЫХ СИСТЕМ, УЧИТЫВАЮЩИХ ИНДИВИДУАЛЬНОСТЬ ПОЛЬЗОВАТЕЛЕЙ

В условиях стремительного роста объёмов грузоперевозок и усложнения логистических процессов особую актуальность приобретает внедрение интеллектуальных технологий, способных адаптироваться к быстро меняющимся требованиям рынка. Одним из таких решений является применение методов машинного обучения на графах для построения рекомендательных систем в логистике. Целью данной работы является исследование возможностей персонализированных графовых моделей, предназначенных для оптимизации логистических процессов за счёт более точного подбора маршрутов, перевозчиков и сопутствующих услуг с учётом индивидуальных предпочтений участников логистической цепочки. В работе исследуется применение графовых методов машинного обучения для построения рекомендательных систем в сфере транспортной логистики с учётом индивидуальных предпочтений пользователей. Предложен подход к персонализации графовых моделей на основе интеграции пользовательских характеристик и динамического пересчёта весов связей в графе. Разработанная модель позволяет оптимизировать логистические процессы, повышая релевантность рекомендаций по выбору маршрутов и перевозчиков. Эффективность предложенного метода подтверждена экспериментальными результатами на реальных данных: достигнуты значения Precision 88 %, Recall 81 % и NDCG 0,94. Представленные результаты демонстрируют преимущества разработанной системы по сравнению с традиционными методами логистического планирования в условиях динамически изменяющейся среды.

Формат документа: pdf
Год публикации: 2025
Кол-во страниц: 1
Загрузил(а): Хасанов Ильнур
Язык(и): Русский, Английский
Доступ: Всем
Статья: ПРИМЕНЕНИЕ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ОПРЕДЕЛЕНИЯ ГРУПП РИСКА ХРОНИЧЕСКИХ ЗАБОЛЕВАНИЙ СРЕДИ ПАЦИЕНТОВ

Хронические неинфекционные заболевания являются важной медико-социальной проблемой, оказывающей существенное влияние на структуру заболеваемости и смертности населения. Актуальность исследования обусловлена необходимостью повышения точности диагностики, персонализации подходов к профилактике и снижению нагрузки на систему здравоохранения. Цель работы - оценка возможности применения современных методов машинного обучения для прогнозирования вероятности развития повышенного артериального давления у взрослых пациентов, наблюдающихся в условиях поликлинического звена. В работе проанализированы обезличенные карты 1843 пациентов. После предварительной обработки, включающей очистку и нормализацию данных, были исследованы следующие алгоритмы: Random Forest, Gradient Boosting, XGBoost, метод K-ближайших соседей и рекуррентная нейронная сеть LSTM. Для верификации качества построенных моделей применялись метрики точности, полноты, F1-мера и ROC-AUC. Результаты апробации показали, что Gradient Boosting и рекуррентная нейронная сеть LSTM наиболее успешно справились с задачей стратификации выборки: пациенты были корректно распределены на группы с отсутствием заболевания, наличием артериальной гипертензии и повышенным риском ее развития. Были показаны ключевые факторы риска - гиперхолестеринемия, неправильное питание и избыток массы тела. Полученные результаты подтверждают целесообразность и перспективность внедрения инструментов машинного обучения, в частности градиентного бустинга и нейросетевых моделей, в клинические информационные системы с целью автоматизированного скрининга артериальной гипертензии и последующего планирования профилактических мероприятий.

Формат документа: pdf
Год публикации: 2025
Кол-во страниц: 1
Загрузил(а): Королева Я.
Язык(и): Русский, Английский
Доступ: Всем
Статья: К ВОПРОСУ ОБ АВТОМАТИЗАЦИИ ПРОЦЕССА СВАРКИ С ИСПОЛЬЗОВАНИЕМ ДУГОВОЙ СВАРКИ И МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ

Целью работы является получение адекватного автоматического алгоритма дуговой сварки, использующего методы машинного обучения для мониторинга параметров сварки, прогнозирования дефектов шва и автоматической корректировки настроек с целью повышения качества и надежности сварных соединений. Настоящая работа посвящена созданию алгоритма для автоматизации дуговой сварки методом MIG/MAG с применением технологий машинного обучения, в частности модели Random Forest. Разработанная система направлена на непрерывный контроль таких параметров сварки, как температура шва, сила тока, скорость подачи проволоки, расход защитного газа и ширина шва. Основная задача - прогнозирование вероятности дефектов сварного соединения и автоматическая корректировка параметров для их предотвращения, что способствует повышению прочности и долговечности конструкций. Алгоритм реализован на языке Python с использованием библиотек Numpy, Sklearn и Matplotlib и адаптирован для работы в среде Google Colab, что упрощает проведение экспериментов и анализ данных. В ходе тестирования система продемонстрировала высокую точность предсказания дефектов (100%), подтвержденную метриками классификации и анализом ROC-кривой. Предложенный подход обеспечивает оптимизацию сварочных процессов, минимизацию производственных ошибок и открывает перспективы для адаптации к другим видам сварки, что делает его ценным инструментом для промышленного применения.

Формат документа: pdf
Год публикации: 2025
Кол-во страниц: 1
Загрузил(а): Выборнов И.
Язык(и): Русский, Английский
Доступ: Всем