Не так давно инженер Роберт Карузо посадил ChatGPT за виртуальную доску против эмулятора Atari 2600 и ее 4-килобайтной игры Video Chess. Результат был неожиданно унизительным для ИИ. Он был «абсолютно уничтожен» в шахматы — так «Чат» сам описал поражение. Но Microsoft Copilot решил, что сможет отыграться за товарища по «интеллектуальному» цеху. Но итог — снова разгром от 8-битного ветерана.
Copilot, как и ChatGPT до него, с энтузиазмом принял вызов. Он заявил, что способен просчитывать 10–15 ходов вперед, но ради «фана» ограничится 3–5, ведь Atari якобы делает «субоптимальные ходы», на которых можно сыграть. Карузо предупредил: ChatGPT проиграл, потому что не мог удерживать в памяти позицию фигур. Copilot заверил, что у него с этим проблем не будет — достаточно лишь скриншотов после каждого хода Atari.
На практике все пошло по знакомому сценарию. Уже к седьмому ходу Copilot потерял двух пешек, коня и слона, забрав взамен лишь одну пешку. Затем он предложил поставить ферзя прямо под удар ферзя Atari — натурально шахматное харакири. Несмотря на регулярные скриншоты, модель снова потеряла нить партии и признала, что ее представление о доске не совпадает с реальностью. Финал был театральным.
«Atari заслужил победу в этом раунде. Я склоняю своего цифрового короля с достоинством и чту винтажного кремниевого мастера, который победил меня честно и справедливо», — заявил Copilot.
Карузо назвал это «дежавю ChatGPT» и подчеркнул, что оба ИИ — не шахматные движки, а языковые модели. Они могут говорить о шахматах, но не играть в них. Их неспособность удерживать даже базовое состояние доски — тревожный сигнал о том, как легко LLM теряют контекст, даже в задачах, где он критически важен.