Нейросеть определяет жанры книг

Исследователи создали четырехслойную сверточную нейросеть (CNN), каждый из слоёв которой состоит из 512 нейронов. Для обучения нейросети ученые загрузили в неё 137788 уникальных обложек книг с Amazon, классифицированных по 20 различным жанрам. Для каждой книги авторы исследования указали только один жанр — который указан на сайте первым.
В ходе испытаний алгоритм научился верно определять жанр в 21,9 % случаях.
«Это показывает, что классификация книг на основе дизайна обложки возможна, хотя и является очень сложной задачей», — говорят авторы.

Биографии и мемуары алгоритм часто относит к смежному жанру исторической литературы, путает детские книжки с комиксами и графическими романами, и почти не отличает медицинскую от другой научной литературы.
Исследование имеет существенный недостаток: ученые не сравнили результаты работы машины с результатами человека. В частности, полезно было бы узнать, насколько точно определить жанр книге по обложке могут пользователи платформы Mechanical Turk на Amazon.
Рекомендуемые книги
Комментарии (0)