Приз Хаттера

редактировать

Приз Hutter Prize - это денежный приз, финансируемый Маркусом Хаттером, который награждает улучшения сжатия данных для определенного текстового файла объемом 1 ГБ на английском языке. В частности, приз присуждается 5000 евро за каждое улучшение на один процент (при общем финансировании 500 000 евро) сжатого размера файла enwik9, который является большим из двух файлов, используемых в тесте сжатия большого текста; enwik9 - это первый 1 000 000 000 символов определенной версии английской Википедии. Текущий конкурс организован Хаттером, Мэттом Махони и Джимом Бауэри.

СОДЕРЖАНИЕ
  • 1 Голы
  • 2 правила
  • 3 История
  • 4 См. Также
  • 5 ссылки
  • 6 Внешние ссылки
Цели

Цель премии Hutter Prize - поощрение исследований в области искусственного интеллекта (ИИ). Организаторы считают, что сжатие текста и ИИ - равнозначные проблемы. Хаттер доказал, что оптимальное поведение целеустремленного агента в неизвестной, но вычислимой среде состоит в том, чтобы на каждом шаге угадывать, что среда, вероятно, управляется одной из самых коротких программ, совместимых со всеми взаимодействиями до сих пор. Однако общего решения нет, потому что сложность Колмогорова не вычислима. Хаттер доказал, что в ограниченном случае (называемом AIXI tl), когда среда ограничена временем t и пространством l, решение может быть вычислено за время O (t2 l), что по-прежнему неразрешимо.

Организаторы также считают, что сжатие текста на естественном языке - сложная задача ИИ, эквивалентная прохождению теста Тьюринга. Таким образом, продвижение к одной цели представляет собой продвижение к другой. Они утверждают, что предсказание того, какие символы с наибольшей вероятностью появятся следующими в текстовой последовательности, требует обширных знаний реального мира. Компрессор текста должен решить ту же проблему, чтобы назначить самые короткие коды наиболее вероятным текстовым последовательностям.

Правила

Конкурс является бессрочным. Он открыт для всех. Для участия участник должен предоставить программу сжатия и распаковщик, который распаковывает файл enwik9. Также можно отправить сжатый файл вместо программы сжатия. Общий размер сжатого файла и распаковщика (как исполняемого файла Win32 или Linux) не должен превышать 99% от предыдущей выигравшей призовой записи. За каждое улучшение на один процент участник выигрывает 5 000 евро. Программа декомпрессии также должна соответствовать ограничениям по времени выполнения и памяти, в настоящее время 100 часов на 1 ядре ЦП с тактовой частотой 3 ГГц и 10 ГБ памяти. Эти ограничения могут быть ослаблены в будущем.

Представленные материалы должны быть опубликованы, чтобы обеспечить независимую проверку. Перед присуждением приза существует 30-дневный период ожидания общественного обсуждения. Правила не требуют выпуска исходного кода, если только такой выпуск не требуется по лицензии на код (как в случае PAQ, который лицензируется по GPL ).

История

Приз был объявлен 6 августа 2006 г. в виде текстового файла меньшего размера: enwik8 размером 100 МБ. 21 февраля 2020 года он был расширен в 10 раз до enwik9 объемом 1 ГБ, аналогично приз увеличился с 50 000 до 500 000 евро. Первоначальный базовый уровень приза составлял 18 324 887 байт, достигнутый PAQ 8F. Расширенный базовый призовой фонд составлял 116 МБ.

16 августа 2006 г. Руди Чилибрази представил модифицированную версию PAQ8F под названием RAQ8G, в которой добавлено моделирование скобок. Однако он не смог достичь порога в 1%.

В тот же день, но через несколько часов Дмитрий Шкарин представил модифицированную версию своего компрессора DURILCA под названием DURILCA 0.5h, который улучшил сжатие на 1,5%. Однако он был дисквалифицирован за использование 1,75 ГБ памяти. Решение о дисквалификации было спорным, потому что ограничения памяти не были четко указаны в правилах в то время.

20 августа Александр Ратушняк представил PAQ8HKCC, модифицированную версию PAQ8H, которая улучшила сжатие на 2,6% по сравнению с PAQ8F. Он продолжил улучшать сжатие до 3,0% с PAQ8HP1 21 августа, 4% с PAQ8HP2 28 августа, 4,9% с PAQ8HP3 3 сентября, 5,9% с PAQ8HP4 10 сентября и 5,9% с PAQ8HP5 25 сентября. Он был объявлен первым обладателем приза Hutter, награжден 3416 евро, а новый базовый уровень был установлен на 17 073 018 байт.

С тех пор Ратушняк несколько раз побивал свой рекорд, став вторым (14 мая 2007 г., когда PAQ8HP12 сжал enwik8 до 16 481 655 байт и выиграл 1732 евро), третьим (23 мая 2009 г., когда decomp8 сжал файл до 15 949 688 байт, и выиграл 1614 евро), и четвертый (4 ноября 2017 г., когда phda сжал файл до 15 284 944 байта и выиграл 2085 евро) победитель приза Hutter.

Смотрите также
Рекомендации
  1. ^ Маркус Хаттер, Конкурс сжатия человеческих знаний, http://prize.hutter1.net/
  2. ^ [1]
  3. ^ a b Мэтт Махони, О тестовых данных http://mattmahoney.net/dc/textdata.html
  4. ^ Маркус Хаттер, Универсальный искусственный интеллект: последовательные решения, основанные на алгоритмической вероятности, Springer, Berlin, 2004, http://www.hutter1.net/ai/uaibook.htm
  5. ^ Мэтт Махони, Обоснование теста сжатия большого текста, 2006 г., http://mattmahoney.net/dc/rationale.html
  6. ^ http://www.compression.ru/ds/
внешняя ссылка
Последняя правка сделана 2023-04-21 08:06:31
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте