Россияне получили доступ к архивам «Советского спорта» за 100 лет
Нейросети «Яндекса» успешно распознали 24 тысячи выпусков газеты «Советский спорт» за сто лет, начиная с 1922 года. Теперь пользователи могут не только просматривать сканы газетных страниц, но и осуществлять поиск информации по номерам и статьям. Это предоставляет широкие возможности для исследования и анализа исторических событий и тем, связанных со спортом.
Кроме того, разработанная технология распознавания текста, использующаяся для работы с газетными страницами «Советского спорта», может быть применена и в других областях, где встречается сложная вёрстка. Нейросети обладают потенциалом для работы с рукописными архивами и даже улучшения функциональности приложений, таких как «Яндекс Переводчик» и умная камера «Яндекса» с помощью ассистента «Алиса».
В начале 2023 года «Яндекс» запустил сервис «Поиск по архивам», позволяющий находить информацию в нейросетями расшифрованных рукописных документах XVIII–XX веков, а теперь он расширяет свои возможности с помощью архива газеты «Советский спорт». База сервиса содержит более 7 миллионов страниц исторических документов из архивов Москвы, Московской, Иркутской, Оренбургской и Новгородской областей, а также нескольких муниципальных архивов.
Доступность онлайн-архивов исторической печати, особенно издававшейся до распространения Интернета, является важной задачей. Многие издания, выпущенные до 2000-го года, почти недоступны для изучения. Библиотеки, такие как зал периодических изданий Российской государственной библиотеки, перестали работать в своих основных зданиях, и архивы были перемещены в другие филиалы, что затрудняет доступ к подшивкам газет.
История архивов газеты «Советский спорт» за 100 лет представляет огромный интерес для исследователей, журналистов, спортсменов и всех, кто интересуется историей спорта. Теперь благодаря нейросетям «Яндекса» эта информация стала гораздо доступнее и удобнее для изучения и анализа. Открываются новые возможности для извлечения знаний и понимания прошлого, а также для применения этих знаний в настоящем и будущем.