Конкурс Hola с призами в 3000 2000 и 1000 USD

Предыдущие сообщения
7 мая 2016
#1 Flash_X uid#496 GeniusКомпания Hola объявляет начало весеннего конкурса по программированию! Призовой фонд увеличен:
  1. Первое место: 3000 USD.
  2. Второе место: 2000 USD.
  3. Третье место: 1000 USD.
Возможно, мы решим отметить чьи-то чрезвычайно оригинальные решения двумя специальными призами в 400 USD.

Если Вы отправите кому-то ссылку на этот конкурс, поставив наш адрес в CC, и этот человек займёт призовое место, Вы получите половину суммы приза (разумеется, не в ущерб награде победителя). За одного победителя такую награду может получить только один человек — тот, кто отправил ссылку первым.

Постановка задачи

Вам нужно написать программу, которая отличает слова английского языка от последовательностей символов, не являющихся словами. В этой задаче мы считаем словами английского языка те и только те строки, которые встречаются в списке words.txt, прилагаемом к условию. Членство в списке регистронезависимое. Казалось бы, это просто — нужно только проверить, встречается ли строка в словаре — если бы не ограничение на размер решения в 64 КиБ.

Едва ли возможно написать программу, которая укладывалась бы в ограничение и всегда давала бы верные ответы. Но 100% правильных ответов и не требуется. Мы измерим, как часто Ваша программа будет отвечать правильно, и победит программа, дающая наибольший процент правильных ответов.

Тема на хабре
Есть идеи?)
03:28:42 0
#2 Flash_X uid#496 Geniusсоветую почитать комменты на хабре 04:00:12 0
#3 kanaris uid#1 как вариант
1) разбить слова на слоги
2) составить список наиболее часто встречающихся слогов или последовательностей букв в англ словах
3) сверять все входящие слова с этим списком.
Может даже меньше получится. Да и на основе данного софта можно генератор новых слов сделать, очень похожих на английские.
12:29:26 0
15 мая 2016
#4 Qemu uid#2451 Дополнительно БД юзать можно? 14:04:40 0
#5 Flash_X uid#496 GeniusНеа, там по ссылке все условия.


4 Канар:
это почти префиксное дерево. Но нет, оно показывает плохие результаты (слишком обширным получается, и приходится обрезать), даже если использовать двойное.
17:13:14 0
#6 kanaris uid#1 Они сами-то решение знают? 11:35:48 0
#7 Flash_X uid#496 Geniusнеа, будет конкурс. Я попробовал нейронку, получилось 63% распознований, это очень мало. Нейронки не вариант.

Нейронки фейлят на псевдо английских словах. Я хз. Единственный вариант, придумать как ужать базу в 64кб.
10:27:07 0
Следующие сообщения
*Ник: Проверка уникальности... Если вы уже зарегистрированы, авторизуйтесь.
*Сообщение:
  Загрузка...