PHP Микрофункция фильтрации текста в UTF кодировке
На вход функции подается произвольный набор символов в UTF кодировке
bool function IsWord($word) { ... }
TRUE функция возвращает во всех случаях
кроме случаев когда она возвращает FALSE
когда в поданном тексте встречается переключение языков (например letoзима) на любых пар языков UTF
когда в поданном тексте встречается переключение буква-цифра (например leto123)
когда в поданном тексте встречается -,_,:,), .... и другие спецсимволы (например le_to, #java, var()
ну уж и понятно что любые варианты где есть двойные перееключения letoзима123, .killer.perl11
допускала бы возможность расширения правил, в частности есть идея частотного анализа символов чтобы понимать может ли слово быть словом русского, английского или другого языка.
Оплата WMR, бюджет думаю, что до 300 рублей.