vse-knigi.com » Книги » Научные и научно-популярные книги » Прочая научная литература » Правосудие в современной России. Том 2 - Екатерина Владимировна Михайлова

Правосудие в современной России. Том 2 - Екатерина Владимировна Михайлова

Читать книгу Правосудие в современной России. Том 2 - Екатерина Владимировна Михайлова, Жанр: Прочая научная литература / Юриспруденция. Читайте книги онлайн, полностью, бесплатно, без регистрации на ТОП-сайте Vse-Knigi.com
Правосудие в современной России. Том 2 - Екатерина Владимировна Михайлова

Выставляйте рейтинг книги

Название: Правосудие в современной России. Том 2
Дата добавления: 26 ноябрь 2025
Количество просмотров: 25
Возрастные ограничения: Обратите внимание! Книга может включать контент, предназначенный только для лиц старше 18 лет.
Читать книгу
1 ... 75 76 77 78 79 ... 120 ВПЕРЕД
Перейти на страницу:
пока в судебно-экспертной деятельности следует использовать алгоритмы обучения с учителем (контролируемого обучения).

Обучение с учителем — это подход к машинному обучению, основанный на использовании наборов размеченных данных, например признаков на пулях и гильзах в баллистической экспертизе[430]. Эти наборы данных применяются для классификации данных или точного прогнозирования результатов. Используя размеченные входы и выходы, модель может сопоставлять входные данные и полученные результаты на точность и постепенно обучаться.

Обучение с учителем может быть двух типов: классификация и регрессия. В задачах классификации используется алгоритм точного распределения тестовых данных по категориям. Распространенными алгоритмами классификации являются метод опорных векторов, деревья решений и случайный лес[431]. Другой тип метода контролируемого обучения — регрессия, когда используется алгоритм, способный прогнозировать ответ из неограниченного числового множества, например есть данные о посещениях занятий и итоговых оценках студентов, и на основании этих данных требуется спрогнозировать посещаемость по итоговым оценкам.

Для разработки экспертных методик на основе нейросетей необходимо создание баз данных — датасетов (англ. — Dataset), которые представляют собой собранные, аннотированные и подготовленные данные по родам и видам судебных экспертиз (признаков), используемые для тренировки и тестирования моделей машинного обучения. Каждый образец представляет собой входные признаки и соответствующий им выходной или целевой признак. Первым шагом в создании датасета является сбор данных, затем аннотация данных — процесс разметки данных с метками, которые указывают на интересующие признаки. Например, для задачи классификации в баллистической экспертизе аннотация может включать в себя присвоение меток к следам нарезов на пуле. Далее идет фильтрация данных, которая дает возможность удалить выбросы, неполные данные или повторы и позволяет избежать переобучения модели. Последним этапом является проверка качества датасета, которая включает анализ сбалансированности, проверку правильности аннотаций и другие метрики. В итоге датасет готов к использованию и может быть размещен в репозитории данных об объектах различных родов судебных экспертиз.

Источниками данных для судебно-экспертных датасетов, которые еще предстоит разработать, являются существующие экспертные методики, многочисленная научная литература по судебной экспертологии. В качестве источников можно применить и существующие экспертно-криминалистические учеты, которые ведутся на федеральном и региональном уровнях в ЭКЦ МВД России и ЭКЦ МВД, ГУВД, УВД субъектов РФ[432].

Источниками данных могут быть и справочно-информационные фонды (СИФ), которые формируются и ведутся в государственных судебно-экспертных учреждениях (СЭУ) и представляют собой натурные коллекции объектов и описания предметов, материалов, веществ, следы которых чаще всего обнаруживаются на местах происшествий. СИФы построены применительно к конкретным родам экспертиз, объектам или методам экспертного исследования и, как правило, являются АИПС.

Главной проблемой всех этих возможных исходных данных является разобщенность, поскольку они сосредоточены в рамках различных ведомств, осуществляющих судебно-экспертную деятельность, недостаточно структурированы и, зачастую, не содержат нужных сведений по современным объектам и методам экспертных исследований. Многие судебно-экспертные методики, разработанные в разных ведомствах, часто противоречат друг другу. Статьи с описанием новых экспертных методик публикуются в ведомственных изданиях, что затрудняет ознакомление с ними. К тому же, поскольку эти методики связаны с исследованием вещественных доказательств по уголовным делам, они имеют ограничения по доступу.

Все это пока не дает возможности говорить о создании единых датасетов и репозиториев по родам и видам экспертиз как хранилищ, содержащих собранные, аннотированные данные, поскольку их формирование требует, в первую очередь, согласования методических подходов различных ведомств к исследованию объектов судебных экспертиз. Тем не менее задачу необходимо хотя бы поставить и наметить направление ее решения в общероссийском масштабе, поскольку негосударственные судебно-экспертные организации и частные судебные эксперты уже начали при производстве экспертиз бесконтрольно использовать нейросети. Опасность заключается в невозможности в этих случаях проверять обоснованность выводов, поскольку правоприменители в достаточной степени не владеют специальными знаниями и, как показывает практика, слишком доверяют тем экспертным заключениям, где много математических выкладок и формул.

Выше уже упоминалось об изменениях компетенций судебных экспертов в связи с трансформациями методологии и технологий судебно-экспертных исследований. Внедрение искусственного интеллекта и нейросетей в судебно-экспертную деятельность обусловливает необходимость появления новых компетенций в судебной экспертологии, которые рассмотрим в русле решения задач машинного обучения.

1. Подготовка данных включает определение того, какие типы данных есть, и проверку их качества. Данные могут быть представлены в виде таблиц, необработанных текстов, изображений или даже графов. С каждым из этих типов данных хорошо работают разные модели машинного обучения. Как и в других отраслях науки, внедрение нейросетей и других алгоритмов искусственного интеллекта обусловливает появление в судебной экспертологии аналитика данных (англ. — Data Analyst) — специалиста, который описывает данные, выявляет в них тренды, анализирует полученные результаты для понимания влияния разных признаков друг на друга. Данные хранятся в датасетах, и аналитики должны уметь с помощью языка запросов извлекать их, отбирать релевантные экспертные признаки, как правило, только самые актуальные. На практике предлагается оставить 20–30 самых подходящих[433]. Этот этап нужен, когда используются нейросети, обучаемые с учителем. В дальнейшем, если будут применяться глубокие нейронные сети, они могут сами извлекать признаки из неструктурированных данных: текстов, фотографий, аудио и видеоизображений.

Аналитик экспертных данных должен обладать знаниями судебной экспертологии и иметь опыт экспертной работы, широкий кругозор и высокий уровень компетенции в данном роде (виде) судебной экспертизы (свойства и признаки объектов, методики и методические подходы экспертных исследований и пр.). Если он не имеет естественнонаучного или инженерного образования, то должен пройти профессиональную переподготовку по математике, теории вероятностей и математической статистике. Аналитики используют Python[434] для анализа, тестирования гипотез, проведения A/B-тестов. Знание IT-инструментов ограничивается Python и SQL[435].

2. Задача инженера экспертных данных (англ. — Data Engineer) структурировать данных в хранилище данные, следить за их целостностью и качеством, контролировать доступы к данным. Он владеет современными технологиями и подходами в области обработки данных, анализирует данные, строит модели и тестирует их. В проектах по экспертному прогнозированию и прогнозной аналитике он может осуществлять содействие в поиске данных. Инженер данных должен разбираться в судебно-экспертных технологиях и знать теоретические и прикладные основы экспертологии.

3. Инженер машинного обучения (англ. — Machine Learning Engineer) обучает модель на данных, оценивает ее качество, проверяет, насколько она эффективна и соответствует заданным результатам (ML-метрикам), устраняет ошибки. Если точность модели падает, инженер выявляет причины и переобучает алгоритм, адаптируя его под изменения данных. Инженер по машинному обучению должен быть специалистом в области IT-технологий, т. е. обладать знаниями алгоритмов машинного обучения, математической статистики, теории вероятности, а также иметь опыт работы в области машинного обучения, разработки программного обеспечения, обработки данных или смежных областях.

В заключении необходимо отметить, что использование нейросетей и других алгоритмов искусственного интеллекта в судебно-экспертных исследованиях открывает совершенно новые перспективы получения криминалистически значимой доказательственной и

1 ... 75 76 77 78 79 ... 120 ВПЕРЕД
Перейти на страницу:
Комментарии (0)