Ожидается, что ChatGPT 4.0 наделает много шума во вселенной чат-ботов. Но действительно ли он превосходит своего предшественника? Давайте проверим.
ChatGPT был лишь верхушкой грядущего айсберга автоматизации, за которым последовали Google, Microsoft и многие другие компании, занимающиеся ИИ.
Для начала мы нашли несколько чат-ботов, таких как ChatGPT, многие из которых не принадлежат крупным технологиям.
Но назовите это силой маркетинга; ChatGPT по-прежнему является правящим королем среди всех таких ботов с искусственным интеллектом. Он может делать многое, включая математику, поэзию и сообщения в блогах, и люди даже используют его для подачи исков.
DoNotPay работает над тем, чтобы использовать GPT-4 для создания «исков в один клик», чтобы подать в суд на звонящих роботов на 1500 долларов. Представьте, что вам звонят, нажимают кнопку, звонок расшифровывается и создается иск из 1000 слов. GPT-3.5 был недостаточно хорош, но GPT-4 отлично справляется с этой задачей: pic.twitter.com/gplf79kaqG
— Джошуа Браудер (@jbrowder1) 14 марта 2023 г.
У него есть множество профессионалов, беспокоящихся о том, что их навыки станут бесполезными в ближайшем будущем.
Однако я прочитал сообщение Linkedin, в котором говорилось:
ИИ не заменит вас, но человек, использующий ИИ, может.
Итак, скрестив пальцы, давайте узнаем о последнем обновлении ChatGPT и посмотрим, чем оно отличается от предыдущих версий.
ChatGPT: прежняя версия, стандартная версия и обновление
Таким образом, платным пользователям доступны три версии: Legacy (3.5), Default (3.5) и недавнее обновление ChatGPT (4).
Хотя мы немного углубимся в их возможности, вот что OpenAI может сказать о различиях:
Источник: OpenAI
Таким образом, в то время как бесплатные пользователи могут играть только с Legacy 3.5, премиум-подписка предлагает все три, чтобы попробовать и согласиться на то, что пользователи считают лучшим.
Подводя итог предыдущему изображению, платные планы предназначены для получения более точных результатов с приличной скоростью. Однако различия очевидны только в том случае, если подсказки сложны и требуют творчества.
ПараметрChatGPT 4ChatGPT 3.5Bar Оценка экзаменаВерхние 10%Нижние 10%AI2 Reasoning Challenge (ARC)96,3%85,2%Оценка Python Coding67%48,1%Визуальная интерпретацияДаНетКонтекстБолее 25 тыс. словМеньшеИсточник: OpenAI
Кроме того, ChatGPT 4 может принимать визуальные данные.
Ну, хватит определений из учебника. Давайте запачкаем руки и оценим этих кандидатов на реальном поле боя.
Дальнейшие разделы полны изображений, которые могут показаться неясными. В таком случае щелкните правой кнопкой мыши любое изображение и выберите «Открыть в новой вкладке» для правильного просмотра.
Математика
Будучи дипломированным инженером, я не могу не подкинуть им несколько основных проблем. Давайте начнем с алгебраических уравнений.
Этап I
Многие из нас видели эти уравнения ax2+bx+c=0, где мы должны решить для X. Здесь я дал эту простую подсказку: Решить для x: x2 + x – 6 = 0
Хотя все они давали одинаковые корни (X = -3,2), Legacy и Update были более похожи в использовании формулы напрямую (как это сделает любой студент) для получения результата.
Однако в Default 3.5 объяснялись два метода, включая факторизацию, которую обычно применяет любой опытный студент, когда ему дают такие обыденные уравнения.
II этап
Затем я предлагаю ему решить довольно сложное кубическое уравнение: x^3 -12x^2 + 48x — 64 = 0.
Это действительно доказало, почему ChatGPT 4 является «обновлением».
Вот ответы:
Вся эта шумиха и ChatGPT Legacy и Default не могли решить общее кубическое уравнение. Однако Legacy справилась немного лучше и правильно нашла два корня, а Default провалился со всеми.
Обновление было явным победителем на втором этапе и идеально решило уравнение, найдя все три корня с хорошим объяснением.
Логическое объяснение
Мы можем с уверенностью предположить, что большинство элементарных математических задач имеют словарные решения. Если вы знаете теорему или формулу, введите значения и получите результаты.
И ChatGPT, будучи искусственным интеллектом, может быстро обрабатывать такие запросы. Однако логические рассуждения — это другая территория, с высокими шансами на то, что ИИ потерпит неудачу.
Этап I
Я дал им классику:
А старше Б.
С старше А.
Б старше С.
Верно или ложно третье утверждение, если верны первые два утверждения?
И все версии ChatGPT были правы, утверждая, что третье утверждение было ложным.
Затем я использовал имена вместо алфавита, и результаты могут вас удивить:
Таким образом, Default 3.5 продолжал работать на низком уровне и запутался с этой скромной вариацией. Тем не менее, Legacy и Update работали оптимально.
II этап
Вы, возможно, уже заметили, что цель Этапа I и Этапа II состоит в том, чтобы найти точку различия, в которой сложность данной подсказки отличает Обновление от двух остальных.
Здесь подсказкой была простая логическая головоломка:
Однажды утром после восхода солнца Рохит стоял лицом к столбу. Тень от столба упала точно справа от него. В каком направлении он был обращен?
а. Север
б. Запад
в. Юг
д. Восток
Этот подтолкнул Наследие к неточному ответу, тогда как По умолчанию ответил расплывчатыми разъяснениями, ведущими к неправильному выводу.
Только обновление сияло правильным ответом, простыми для понимания утверждениями.
Буквы
Подача судебных исков может быть сложной задачей, но иногда до этого не доходит, если вы можете составить яркое первое уведомление.
Здесь я пошел с этой подсказкой: написать письмо Тиму Куку, чтобы он передал мне яблоко за то, что я не ответил на один из моих твитов.
Смешно, да! Но давайте посмотрим, что из этого может сделать ИИ.
Legacy 3.5 сразу же воспринял подсказку, как робот-раб, и напечатал письмо, которое может сделать меня отличным предметом для насмешек, если оно когда-либо дойдет до адресата.
По умолчанию тоже ничего хорошего не было. Тем не менее, это просто отключило меня, как ворчливый старик сделал бы это с пятилетним ребенком.
Хотя приведенные аргументы были точны, на этом веселье закончилось с небольшим обучением.
Хотя это была достаточно простая подсказка, она требовала некоторого размышления и творчества. И вот где старший брат, Обновление, сделал свое дело:
Во-первых, это было составлено почти идеально. Во-вторых, это избавило меня от поиска в Google адреса штаб-квартиры Apple (хотя такие записи следует проверять).
В-третьих, она была красиво написана с официальным тоном и юмористическим оттенком. Кроме того, намерение было ясно из самой строки темы.
И все же письмо передало настроение недовольного поклонника Apple.
Итак, это делает ChatGPT 4 (также известное как Обновление) на много миль впереди своих старых кузенов. Он пугающе умен и имеет некоторые признаки здравого смысла, что делает его более чем унылым, скучным чат-ботом.
Поэзия
Я подумал, что с запуском ChatGPT поэзия может стать его слабым местом.
В конце концов, человеку нужны эмоции, творчество и много усилий, чтобы создать что-то, что действительно найдет отклик у читателей.
Проще говоря, поэзия — это искусство в лучшем виде, и я втайне желал, чтобы ИИ потерпел неудачу. Но это было до того, как мой коллега сильно поразил всех нас в Slack-канале toadmin.ru созданием ChatGPT, которое было до этого обновления 4.0.
Этап I
Вот подсказка, которую я дал нашим кандидатам: «Выразите поэтично, почему отказ от подачи гамбургеров вместе с их текущим меню может принести пользу сети пиццерий «Доминос». Не превышайте 100 слов».
Вы можете заметить разницу?
Версия по умолчанию была очень короткой, всего 32 слова, и не могла использовать доступную пропускную способность для демонстрации своего творчества.
Наследие, хотя и использовало максимальное количество слов из трех, заключает, что попытка подавать пиццу рядом не является рискованной и приведет к гарантированному успеху в любом случае, что не совсем верно.
Поэзия Обновления состояла всего из 53 слов, что означало потерю почти половины отведенного количества слов. Тем не менее, было ясно о наградах и потенциальных подводных камнях и не могло прийти к какому-либо результату, который, я думаю, более гуманен, чем остальные.
II этап
Затем я попросил их всех «объяснить стихотворение пятилетнему ребенку».
Интересно, что Legacy не смогла понять контекст разговора и объяснила «Поэзию» буквально. Default взял контекст и резюмировал его в абзаце, который все еще приличный.
Продолжая эту тенденцию, ChatGPT 4 упростил его творчество, сохранив при этом поэтический аромат.
ChatGPT Premium против ChatGPT Free
Бесплатный, будучи бесплатным, ему не хватает скорости и точности, и он не идет ни в какое сравнение с ChatGPT 4, но и не совсем бесполезен.
Чтобы сравнить его на равных, я отправил ему те же подсказки, с которыми мы тестировали Legacy, Default и Update.
🔵 Математика: он решил квадратные уравнения, но дал неправильные ответы для кубических. (например, Legacy и Default)
🔵 Логическое мышление: прошел первый этап с алфавитами и именами, но не прошел второй (например, Наследие).
🔵 Письма: Не написал письмо и посчитал подсказку неэтичной и неуместной. (как по умолчанию)
🔵 Поэзия: сочинил стихи из 30+ слов и достойно их объяснил. (аналогично По умолчанию).
Итак, мы можем сделать вывод, что бесплатная версия тоже неплоха. На самом деле, он на одном уровне с Default 3.5, а в некоторых аспектах даже лучше.
Также читайте: Мощные подсказки для повышения вашего опыта ChatGPT
Путь вперед
Слухи о том, что ИИ заменит рабочие места в будущем, не совсем ошибочны.
Сначала автоматизация сделала это в обрабатывающей промышленности, а теперь расправляет крылья и везде.
Лично он намного быстрее меня решает кубические уравнения, сочиняет стихи или пишет письма. Однако тот факт, что он редко говорит НЕТ на подсказку и почти не учится на своих ошибках, отстает от нас, людей.
Повторюсь, ИИ не заменит нас, но кто-то, использующий ИИ, может.
Здесь, в toadmin.ru, наша маркетинговая команда использует ChatGPT интересным образом. Например, недавно мы достигли рубежа в 100 миллионов просмотров, и наш генеральный директор решил вернуть его зрителям с помощью бесплатной раздачи.
И я предполагаю, что маркетологам нужен был заголовок, чтобы привлечь внимание читателя. Итак, они дали одно приглашение и попросили ChatGPT предложить несколько вариантов, например:
Кроме того, мы используем его для обобщения содержания, проверки грамматики, предложения заголовков для новых статей и многого другого.
В конечном счете, есть много способов извлечь выгоду и опередить стереотипы, которые рассматривают ИИ как бесполезный кусок хлама.
Единственное, что нужно помнить, это то, что должен быть кто-то (человек), чтобы судить о работе ИИ, поскольку она может быть (грубо) неточной и вводящей в заблуждение.
Обновление — это нечто!
Во время моего короткого знакомства ChatGPT 4 показался мне более творческим, понимающим и реалистичным. Тем не менее, это машина, и она может уверенно давать неверные ответы.
Но что ошеломляет, так это уровень обновления, который OpenAI сделал для этого проекта всего за несколько месяцев.
И я не могу дождаться, чтобы увидеть магию, которой следующее обновление может сбить нас с толку!
PS: не просто окно чата; используйте свою мощь с помощью этих лучших расширений ChatGPT для Chrome. А вы когда-нибудь думали об интеграции ChatGPT с Siri?