Anthropic пересматривает тесты для соискателей из-за успехов своей нейросети Claude

Блоги

25 янв., 09:20 Inthenews

Компания Anthropic обновила формат домашних технических заданий для инженеров после того, как ее ИИ стал показывать результаты не хуже ведущих кандидатов

В официальном блоге компания сообщила, что каждая новая версия Claude вынуждала пересматривать процедуру оценки соискателей на инженерные позиции, поскольку модель начала уверенно проходить внутренний тест. Claude Opus 4 опережал большинство претендентов при том же лимите времени, а Claude Opus 4.5 вышел на уровень самых сильных кандидатов, из‑за чего стало сложно отличить работу людей от решений ИИ в рамках домашнего экзамена.

Может быть интересно

На этом фоне Anthropic сочла необходимым переработать испытание, чтобы сохранить отчетливый вклад человека и по‑прежнему видеть разницу в уровне подготовки кандидатов.

Компания опубликовала исходный вариант домашнего тестового задания и предложила всем желающим попробовать улучшить результат Claude. Тем, кто превзойдет показатели модели, обещают внимательно рассмотреть резюме при найме.

#anthropic #нейросесть #claude opus 4 #claude opus 4.5

Источник: dataconomy.com

+

Написать комментарий (0)

Наш Telegram-канал @overclockers_news
Подписывайся, чтобы быть в курсе всех новостей!

Эффективная реклама для вашего бизнеса

Эксперт показал степень выгорания OLED-панели после двух лет использования

3

Гонка на выживание Carmageddon Rogue Shift добралась до релиза

+

Удачливый покупатель приобрёл на распродаже несколько SSD в разы дешевле их текущей цены

4

SpeedMe.ru: КАМАЗ запатентовал новый интерьер грузовика

6

В сети зафиксирован один из самых серьёзных прогаров среди видеокарт Nvidia GeForce RTX 40

2

Popular Mechanics: Вселенная может «испариться» гораздо раньше, чем считалось

+

Ученые называют срок в 5,5 дней от сильной солнечной бури до массового схода спутников с орбиты

+

Энтузиаст протестировал ПК на Ryzen 5 3600 с Radeon RX 6650 XT в популярных играх

+

Poco опубликовала дизайн и цены смартфонов Poco X8 Pro и Poco X8 Pro Max

+

Core i9-14900K стал лидером по числу возвратов по гарантии в Mindfactory за последнее время

63

Новое картографирование местности выявило на севере Австралии обширную магнитную аномалию

+

Fractal Design представила корпуса North и North XL серии Momentum Edition в полностью черном цвете

+

Полёт свиньи на дроне оставил без электричества деревню в Китае

1

ВТБ представил новый портрет пострадавших от действий мошенников доверчивых граждан в 2025 году

+

Удачливый покупатель приобрёл GTX 1080 Ti всего за 5 евро и уже успел поиграть на ней в Helldivers 2

5

Nvidia рекомендует удалить январское обновление Windows 11 KB5074109 владельцам видеокарт GeForce

+

Производитель самолётов МС-21 оборудовал цеха современными отечественными фрезерными станками

+

Энтузиасты поймали радиосигнал Voyager 1 с расстояния более 25 млрд километров от Земли

+

Под брендом ZOTAC Gaming представили первый компьютерный корпус Alloy

+

Popular Mechanics: Ученые 60 лет не могут объяснить загадочную 26-секундную пульсацию Земли

1

Почему игровой движок Godot пригоден для разработки перспективных проектов — в чём не прав Chimbal

5

Очень краткий обзор второго сезона сериала «Fallout»

3

Прокачиваем ПК на максимум с помощью полезных плат расширения, адаптеров и переходников. Часть 2

11

От одиночества к сообществу — почему я никогда не откажусь от онлайн-игр в пользу одиночных

22

Тест производительности Windows 11 против Windows 7 на устаревшем ПК

62

NuclearMissionJam

12:18

К сожалению, да И токсики еще. Есть несколько десятков проектов, что померли из-за токисков

От одиночества к сообществу — почему я никогда не откажусь от онлайн-игр в пользу одиночных

NuclearMissionJam

12:18

Потому что талантливые люди из студий уходят, а остаются те, кто либо все руинит, либо не может ничего сделать из-за жестких рамок, что ставят проджект-менеджеры. Фактически, культура творцов в игровы...

От одиночества к сообществу — почему я никогда не откажусь от онлайн-игр в пользу одиночных

12:14

За 5 евро какую-нибудь 9800 GT продают, а не 1070 и уж тем более 1080 Ti.

Удачливый покупатель приобрёл GTX 1080 Ti всего за 5 евро и уже успел поиграть на ней в Helldivers 2

Сергей Анатолич

12:10

Наверное поедет отговаривать Си покупать в России газ и нефть. Ну, удачи. Пока, что Трамп с Индией договаривается о запрете покупок нефти у России, а объёмы покупок этой самой нефти у России всё увил...

FT: Визит Трампа в Китай может быть отменён из-за поставок оружия Тайваню

12:09

А ты сам то понимаешь или опять просто ртом работаешь?

Тест производительности Windows 11 против Windows 7 на устаревшем ПК

12:07

Алкаш, ты лучше дальше продолжай накатывать по стопарику и дальше шизофренировать.

Тест производительности Windows 11 против Windows 7 на устаревшем ПК

12:06

Там особо знать нечего и это дерьмище не кому ненужно. Потому что NFS лютый кал для анэнцефалов некрофилов.

Тест производительности Windows 11 против Windows 7 на устаревшем ПК

Сергей Анатолич

12:05

Опять Петров и Баширов безобразят?

В Италии полиция сообщила о диверсии на железной дороге в первый день Олимпиады

12:03

Сетевой протокол доступа к файлам. Но ты - анэнцефал, можешь это считать файловой системой.

Тест производительности Windows 11 против Windows 7 на устаревшем ПК

11:55

Доказательства неси. Без доказательств ты уже слился. А свои эротические фантазии рассказывай любовнику своей жены.

Тест производительности Windows 11 против Windows 7 на устаревшем ПК