Проверяю систему анализа текстов и статей TEXT.RU
реклама
И опять: идея для статьи не моя. Я ее нагло подсмотрел в "непринужденной" беседе между нашим блогером Manager-ом и "первым Апшеронским ИИ" с многотысячными аккаунтами (имя ему Легион...)
реклама
Суть спора: статьи допускаются до публикации, если соответствуют неким параметрам. Ну, понятно, что статья должна быть более-менее оригинальной, а не являться плагиатом. Хотя использование систем "ЧуДжиПукТи" спокойно проходит. Это я уже отлично увидел в текстах одного блогера...
Еще важны такие параметры, как "вода" и "заспамленность текста". А это что за "звери"?
реклама
Ищем информацию в "тырнете".
"Вода в тексте – это относительный показатель концентрации слов без смысловой нагрузки (стоп-слов). Слишком большой процент указывает на низкое качество материала. Поисковые системы хорошо ранжируют страницы с информативным контентом. Но это не значит, что водность нужно стараться свести к минимуму. Норма воды в тексте ограничена показателем 60 %".
"Заспамленность текста — это слишком частое повторение ключевого слова в тексте. Измеряется соотношением количества вхождений ключевого слова к общему числу слов в тексте. Заспамленность не должна превышать 60%. Тексты с высоким процентом заспамленности могут пессимизироваться поисковыми роботами (позиции понижаются за переспам), а при большом количестве аспамленных веб-страниц — сайт и вовсе могут забанить и он исчезнет из результатов поиска".
Это, конечно, интересно. Но каково это будет выглядеть в конкретных примерах? Интересно будет проверить на состоятельность подобных заявлений.
реклама
Сам я никогда до этого подобными ресурсами не пользовался, не доверяю я всяким ИИ (сразу вспоминается Скайнет). Ну а проверять собственноручно написанный текст на оригинальность, не имеет смысла.
А тут, была дана конкретная ссылка на ресурс. Почему бы и нет?
Скажу сразу: ресурс условно бесплатный. В сутки вы можете проверить на оригинальность и прочее, только определенное количество символов.
Проблем с проверкой на оригинальность не было вообще. Сайт достойно справлялся с данной задачей, верно указывая первоисточник. Но я и не пытался программу обмануть: не использовал немного переработанный "гуглоперевод" или подобное. Просто вставлял текст на русском и запускал проверку. Но меня больше заинтересовали параметры "вода " и "заспамленность". И вот тут вылез очень интересный момент...
реклама
Для начала, что написано об этих параметрах на самом сайте:
Как видите, в целом совпадает с тем, что я нашел в интернете. А как это выглядит в реальных текстах?
Для начала, пробую отрывок из своего рассказа, опубликованного на сайте:
Вода - 21%, заспамленность - 39%. На количество ошибок можете не обращать внимание, тут многие системы не справляются. Хорошо у меня вышло или нет? Сказать однозначно не получится. Попробуем другой мой рассказ, но еще не опубликованный (модератор сказал: "пиши исчо дальше"):
Вода - 18%, заспамленность - 38%. И опять ничего не ясно. Надо сравнить с авторами, которые пишут статьи профессионально. Для этого я взял статью с сайта АВТОРЕВЮ, написанную Андреем Васильевичем Хрисанфовым,
одним из лучших авторов данной газеты, который, к сожалению, покинул наш бренный мир...
Его статьи про автомобили очень легко читаются. Проверим, что насчитал TEXT.RU:
Вода - 25%, заспамленность - 36%... Хм... Адекватность проверки находится под вопросом... Если к своему "творчеству" трудно относится объективно, то уж тут профессионал высокого уровня. И довольно средние параметры. А точно, это что-то значит?
Усложняем задачу и переходим и отрывкам из классических произведений. Программа опять справилась с нахождением оригинала, но вот остальное...
Для начала, я решил поэкспериментировать с товарищем Говардом Филлипсом Лавкафтом
и его романом "Хребты безумия". Фирменный "почерк" Лавкрафта тут присутствует. "Тягучий язык", множественные обороты. Короче читается не особо легко. А что нам скажет анализ текста:
Вода - 32%, заспамленность - 31%. Ой! А что это наш Лавкрафт плохо пишет тексты! Ой, так не дело! Вода у него водянистая... А! Понял! Он же в своем творчестве много уделял внимание культу Ктулху.
А он у нас живет в воде... Теперь все сходится! Ну не может же анализ ошибаться...
Проверим на другом авторе. Он тоже имеет мировую известность, но работал в другом жанре. Это Эрих Мария Ремарк
с произведением "Черный обелиск" (музыкальный коллектив с таким же названием появился гораздо позже). Очень тяжелое, по сути, произведение. Не по написанию, а по наполнению смыслом. Кто читал, тот поймет.
Вода - 21%, заспамленность - 58%. Опять не ахти. Причем, показатель заспамленности близок к критическим 60%. Значит, Ремарк тоже плохо пишет?
Проверим еще одного писателя с мировым именем. "Старик и море" - наверно, самое известное произведение Эрнеста Хемингуэя.
И опять вышло как-то не так: вода - 23%, а заспамленность - аж 65%. То есть такой текст неприемлем с точки зрения ИИ?
Ладно, будем считать, что писатели тут не виноваты, а все переложим на "бездарных переводчиков". Значит, проверяем русского писателя. Раз я задал довольно высокую планку авторов, то и среди русских писателей выберем незаурядного. Просто "столп русской литературы". Встречайте, Лев Николаевич Толстой, собственной персоной
и его всемирно известный роман "Анна Каренина":
Воды тут немного меньше - 17%, а вот заспамленность не "фонтан" - 40%. На перевод тут уже не спишешь. Значит и Лев наш подкачал?
Возьмем писателя рангом пониже, но отличающегося "восточной цветастостью" своего произведения. Речь о писателе Леониде Васильевиче Соловьеве
и его произведении "Повесть о Ходже Насреддине".
И в который (!) раз вода - 14% (пока это лучший результат), а заспамленность - 40%... И этот автор, с великолепным слогом и изложением, не "алё" по мнению электронного анализа...
А может все гораздо проще? Может просто подобные анализы не стоят и ломаного гроша? Как и все нынешняя реализация ИИ? Может эти алгоритмы подходят для простых "писулек" строго формального формата (о, как завернул)? Один раз я уже разочаровался в "интеллекте" ChatGPT. Он оказался абсолютно беспомощным в ответе на технические вопросы. И тут повторяется та же история. Ведь то, что считается "водой" и "заспамленностью", на самом деле фирменная черта писателя! Его стиль! И мы именно за это ценим их. Если же следовать "советам" подобных ресурсов, то у вас получится абсолютно убогий, ничем не выделяющийся текст. Может для ИИ это и хорошо, но мы же люди! Со своими взглядами и суждениями. И с какой радости нам следовать указаниям ИИ, которого сами и создали? Чтобы стать в конечном итоге болванчиками "неписей" из "божественного" "Старфилда"?
Одно успокаивает в этой ситуации: судьба людей, подвергнувшимся уничтожению Скайнета, нам не грозит...
P.S.: И, да: работать с фотографиями животных ИИ тоже не особо "могёт"...
реклама
Теги
Лента материалов
Интересные материалы
Возможно вас заинтересует
Соблюдение Правил конференции строго обязательно!
Флуд, флейм и оффтоп преследуются по всей строгости закона!
Комментарии, содержащие оскорбления, нецензурные выражения (в т.ч. замаскированный мат), экстремистские высказывания, рекламу и спам, удаляются независимо от содержимого, а к их авторам могут применяться меры вплоть до запрета написания комментариев и, в случае написания комментария через социальные сети, жалобы в администрацию данной сети.
Комментарии Правила