Энергия искусственного интеллекта

Готов ли ChatGPT двигаться по пути устойчивого развития?
26.04.2023
Алексей Батырь

Осенью прошлого года компания OpenAI предоставила широкой публике доступ к разговорному боту ChatGPT. Он поразил пользователей Интернета широкими возможностями, которые не ограничиваются разговорами на общие темы. Бот, насчитывающий 175 миллиардов искусственных нейронов, составляет программы для компьютеров, переводит тексты с одного языка на другой, пишет стихи в разных стилях, не поддаётся на обман (то есть критически оценивает запросы человека) и, что самое удивительное, часто даёт толковые ответы на сложные вопросы. За первые два месяца аудитория активных пользователей бота достигла ста миллионов человек.

Войдёт ли выпуск ChatGPT в историю как начало эры искусственного интеллекта (ИИ)? Вполне возможно: имея доступ к ИИ, люди пробуют его возможности в самых разных сферах. Так, пользователь YouTube с псевдонимом Enderman использовал бот для того чтобы генерировать ключи активации к операционной системе Windows 95. Мой знакомый с помощью ChatGPT сумел найти в Интернете фотографию печатной платы, которую уже отчаялся искать средствами Google.

Педагогов волнует тот факт, что ChatGPT выполняет школьные задания на уровне хороших учеников. Офисные работники опасаются конкуренции со стороны компьютеров. Забеспокоились даже учителя английского: ChatGPT готов болтать с пользователем в любое время дня и ночи, поправляя неверно построенные фразы, стоит лишь об этом попросить.

Прожорливый субъект

Нейросеть, в которой реализован алгоритм ChatGPT, находится в «облаке», то есть в арендуемых вычислительных системах. Для надёжного доступа из разных регионов в любое время суток такие системы располагаются в центрах обработки данных (ЦОД) сразу на нескольких континентах. И хотя каждый ЦОД выполняет множество задач, ясно, что ChatGPT добавил к их энергопотреблению не один мегаватт. С начала февраля нынешнего года пользователи на страничке регистрации стали получать сообщения: "ChatGPT is at capacity right now" («Сейчас ChatGPT полностью загружен»). Между тем у облачных систем ограничений по вычислительной мощности и трафику не бывает - поставщики услуг всегда готовы подключить дополнительные серверы и расширить каналы связи. Значит, компания OpenAI вынуждена экономить на счетах за аренду серверов и линий.

В прошлом веке человечество столкнулось с проблемой устойчивого развития, то есть такой организации общества, когда его текущая жизнедеятельность не осуществляется за счёт будущего. Сегодня к этой проблеме добавляется широкопрофильный искусственный интеллект. Факт потребления энергии и других материальных ресурсов ботом ChatGPT очевиден, а его общественная польза пока остаётся под сомнением.

Узкоспециализированные нейронные сети, используемые в различных сферах науки и техники (например, для анализа режимов работы энергосистем), окупаются благодаря экономическому эффекту, высвобождая время и силы людей. Искусственный интеллект широкого профиля, наоборот, пока оттягивает на себя их время и силы. Когда мы научимся продуктивно использовать ChatGPT (решение школьных заданий не в счёт), неизвестно.

Поскольку ChatGPT имитирует мозг, отрезанный от органов чувств, для него было бы естественно взять на себя какие-то научные и управленческие задачи для сокращения административной и бюрократической прослойки в компаниях и государственных организациях. Однако до этого момента ему предстоит пройти большой путь по дороге совершенствования и, как ни странно это звучало бы, по дороге самосовершенствования.

Микросхемы Максвелла

Идею проще всего пояснить на примере вычислительной литографии. Что это за зверь? В современных микропроцессорах минимальные размеры топологических элементов уже исчисляются единицами нанометров, а длина световой волны в установке фотолитографии, которая формирует точнейший рисунок на кремниевой подложке, составляет сотни нанометров. Казалось бы, такая фотолитография из-за эффектов интерференции света невозможна. Но - как раз наоборот: именно благодаря интерференции она очень даже возможна!

Вычислительная литография используется в микроэлектронике уже больше тридцати лет. Компьютеры синтезируют рисунок на фотошаблоне по уравнениям Максвелла так, чтобы неизбежные эффекты интерференции создали требуемую засветку фоторезиста. Итоговые маски выглядят, мягко говоря, не совсем так, как формируемые с их помощью рисунки.

В сложных микросхемах используются десятки слоёв металлизации, диэлектрика и полупроводников. Для их получения нужны десятки фотошаблонов, создаваемых на мощнейшем суперкомпьютере. Например, при производстве нового графического акселератора nVidia H100 с тензорными ядрами задействуется 89 фотошаблонов. Каждый из них просчитывается в ЦОДе на протяжении двух недель.

В инверсной литографической технологии рисунок маски
оптимизируется так, чтобы получить нужную картинку
на фоторезисте

Микроэлектронные предприятия имеют крупные центры обработки данных, построенные на самых совершенных серверах, и по всему миру ежегодно потребляют десятки миллиардов процессор-часов. Знаменитый тайваньский производитель микросхем, компания TSMC эксплуатирует вычислительные системы, которые в сумме насчитывают сорок тысяч процессоров.

В то время как технологические нормы сокращаются, вычислительная нагрузка только увеличивается. При этом объём литографических расчётов прирастает быстрее, чем количество транзисторов на кремниевом кристалле. Отсюда - задержки с разработкой и выводом микросхем на рынок. Тормозится развитие не только микроэлектроники, но и других отраслей, где широко используется микроэлектронная продукция, включая энергетику и электротранспорт.

Таким образом, компьютеры в мощнейших вычислительных центрах используются для создания новых микропроцессоров, которыми в свою очередь оснащаются новые компьютеры. Круг замыкается, техника «сама себя совершенствует».

Графика для оптики

Недавно компания nVidia построила специализированную программную библиотеку CuLitho, которая позволит в вычислительной литографии вместо центральных процессоров задействовать графические акселераторы. По прикидкам nVidia, с их помощью компания TSMC сможет заменить сорок тысяч центральных процессоров на пятьсот новейших вычислительных модулей nVidia DGX-H100 с фирменной технологией Cuda, снизив энергопотребление ЦОДов с 35 до 5 МВт. Поскольку время просчёта каждого фотошаблона сократится с двух недель до восьми часов, вырастет и скорость разработки новых микросхем.

В вычислительной литографии используются два основных алгоритма: OPC (optical proximity correction - коррекция эффектов оптической близости) и ILT (inverse lithography technology - инверсная литографическая технология). Компания nVidia поддерживает алгоритм ILT, который требует большего объёма вычислений, но зато обеспечивает хорошую глубину резкости (читай: при экспозиции вся кремниевая пластина будет в фокусе).

На создание библиотеки CuLitho компания nVidia потратила почти четыре года. Специалисты приспосабливали операции с графическими примитивами, на которые рассчитаны видеокарты, к решению задач волновой оптики. При этом они широко использовали операции свёртки, применяемые в системах ИИ.

Компания TSMC собирается задействовать вычислители и новую библиотеку nVidia уже с лета этого года. Производитель чипов надеется не только сократить сроки создания продукции и сберечь энергию, но и нарастить выход годных изделий, тем самым удешевив новые микросхемы.

Несмотря на то что в микроэлектронике уже лет двадцать говорят о необходимости перехода на ультрафиолетовую литографию, такой переход только начинается. На подходе - технологические нормы 2 нм, при которых расчёты масок усложнятся настолько, что энергопотребление центров обработки данных потянет на сотни мегаватт. В таких условиях переход на графические процессоры - насущная необходимость. А старые вычислительные системы можно пустить на искусственный интеллект ChatGPT.

Читайте другие наши материалы