Разработан новый математический процесс, позволяющий кардинально уменьшить наборы данных для обучения систем искусственного интеллекта

Большие данные

Группа ученых университета Ватерлоо, Канада, работающих в области математической статистики, предложила и реализовала идею нового математического процесса, позволяющего быстро и эффективно производить обучение систем искусственного интеллекта. При этом, для достаточно высококачественного обучения при помощи нового метода не требуется использования больших наборов исходных данных, таких, которые необходимы при традиционном подходе.

Отметим, что приложения на основе систем искусственного интеллекта были одним из основных направлений исследований в области информационных технологий в последние годы. Развитие технологий глубинного машинного обучения и искусственных нейронных сетей привело к тому, что системы на их основе уже начали широко использоваться для проведения медицинской диагностики, для анализа изображений на фото и видео, для создания искусственных, но фотореалистических фотоснимков и видеороликов, и, даже, для создания произведений изобразительного искусства и музыкальных произведений.

Однако процесс глубинного обучения искусственных нейронных сетей требует использования огромных наборов предварительно подготовленных, отсортированных и проиндексированных данных. И, естественно, перед учеными стоит задача уменьшения объема данных для обучения с сохранением высокого уровня обучения нейронной сети. Ученые отметили, что ребенку, к примеру, для того чтобы он начал распознавать какое-либо животное, надо показать всего несколько его изображений, а не тысяч и сотен тысяч изображений, как требует обучение нейронной сети. И они задались вопросом, можно ли использовать математику для решения этой проблемы?

Ученые взяли один из стандартных наборов данных, MNIST, в котором содержатся данные о рукописных символах и который используется для обучения систем искусственного интеллекта, выполняющего функцию распознавания рукописного текста. Отфильтровав по своим критериям информацию, ученые получили значительно сокращенный набор данных, который, тем не менее, мог использоваться для обучения нейронной сети. При этом, процесс обучения сети также был кардинально изменен, к примеру, вместо того, чтобы прогнать через нейронную сеть несколько тысяч изображений числа 3, нейронную сеть обучили тому, что число 3 — это символ, который на 30 процентов меньше символа, соответствующего числу 8. И такие перекрестные указатели-ассоциации были сделаны для каждого символа.

Новый метод машинного обучения получил название kNN (k-nearest neighbor). Затем подобный подход был использован по отношению к наборам данных, описывающих взаимосвязи между координатами Х и Y для различных функций. Обученная система искусственного интеллекта оказалась способной правильно расставлять точки на графиках, при этом, для ее обучения был использован весьма сокращенный (по отношению к исходному) объем данных.

Весь новый процесс обучения и отбора только необходимых данных для обучения ученые назвали LO-shot (less than one-shot learning). Сейчас ученые пытаются адаптировать его для решения задач из других областей и преодолеть главное препятствие. А это главное препятствие заключается в том, что для создания сокращенного набора данных для обучения нейронных сетей пока еще требуется очень большой набор начальных исходных данных.

Ключевые слова:
Процесс, Математика, Обучение, Нейронная, Сеть, Искусственный, Интеллект, Набор, Данные, Объем, Размер

Первоисточник

Другие новости по теме:

  • Обучение искусственного интеллекта людьми дает лучшие результаты, чем его с …
  • Искусственный интеллект Google DeepMind научился читать по губам лучше, чем …
  • Создана самая большая нейронная сеть, предназначенная для реализации технол …
  • Новая «добавка» к системе OpenAI позволяет проводить обучение роботов в в …
  • Компания Google показала, на что похожи «мечты» их систем искусственного …
  • Share Button

    Материалы по теме:

    Квантовый компьютер Quantinuum System Model H1-1 продемонстрировал превосходство над классической системой в специальной тестовой игре
    Некоторые из людей рассматривают компьютерные игры только в качестве средства развлечений. Но профессор Эмануэль Дала Торре (Emanuele Dalla Torre) из университета Бар-Илана, Израиль, и ...
    Ученые создали «живой компьютер», использовав искусственно выращенные клетки головного мозга
    Группа исследователей из университета Иллинойса создала то, что можно назвать термином "живой компьютер". Главным элементом этого компьютера являются искусственно выращенные клетки тканей головного мозга, ...
    DSO.ai — ИИ-«инженер», который уже разработал более 100 чипов
    Процесс проектирования новых чипов является весьма сложной работой, результат которой во многом зависит от человеческого фактора - квалификации выполняющего ее специалиста. Однако, эта тенденция ...
    Компания IBM представила новый квантовый процессор, который невозможно смоделировать при помощи обычных суперкомпьютеров
    Буквально на днях компания IBM сделала достаточно большой шаг на пути к реализации практических квантовых вычислений. Представители компании анонсировали новый квантовый процессор, Eagle, в ...
    Ученые нашли совершенно новый способ измерения времени
    Использование секундомера, механического или электронного, имеющегося в каждом мобильном телефоне, является самым простым способом подсчета количества секунд между точками времени "до", "сейчас" и "после". ...
    You can skip to the end and leave a response. Pinging is currently not allowed.

    Leave a Reply

    Яндекс.Метрика