Луч­ший спо­соб соз­дать изоб­ражение, на котором есть нуж­ные тебе объ­екты в нуж­ной сти­лис­тике, — пос­мотреть при­меры на одном из круп­ных пор­талов и ско­пиро­вать тек­сто­вый зап­рос, отре­дак­тировав его в тре­буемом нап­равле­нии. Или нет? Прак­тика показы­вает, что мно­гие поль­зовате­ли без­думно копиру­ют зап­росы, бук­валь­но зах­ламлен­ные бес­смыс­ленны­ми токена­ми.

Се­год­няшняя тема — одна из самых важ­ных в серии ста­тей о генера­тив­ном искусс­твен­ном интеллек­те: мы будем сос­тавлять зап­росы, и делать это пос­тара­емся пра­виль­но.

Как‑то раз я помогал сге­нери­ровать обложку для кни­ги. У кол­леги не задалось, а ког­да я поп­росил прис­лать зап­рос, уви­дел вот это:

A dynamic action shot captures a volleyball player in mid-air as she strikes the ball with her right hand, while wearing a forest green jersey with white and black accents, bearing the number 8. The player’s blonde hair is tied back in a ponytail, and her face shows intense focus on the task at hand. Her left arm is supported by a white sleeve or pad around the elbow. She wears knee-high white leg warmers and pink volleyball shoes with light blue soles. The volleyball, with its distinctive yellow exterior and blue sections divided by vertical ribbons, is held high above her head. In the foreground, two opposing players are attempting to block the serve; one is seen from behind with arms fully extended upwards, while another with the has both hands raised high, fingers spread wide. Both opponents wear dark jerseys with intricate red, white, and black patterns. They also have black arm sleeves, with sleeve showcasing a vibrant blue and pink pattern. Both players have their heads turned slightly towards the camera, revealing part of their faces. The net, spanning horizontally across the middle of the frame, features a white mesh structure with black lines forming a square grid pattern. The floor beneath them is teal blue, contrasting sharply with the orange area where the players are standing. The overall lighting is bright and even, typical of an indoor sports arena, highlighting the athleticism and competitive nature of the moment.

Чес­тно говоря, понять, чего хочет воп­роша­ющий, я не смог; мне приш­лось при­бег­нуть к помощи ChatGPT, что­бы тот рас­шифро­вал зап­рос. Тек­сто­вые декоде­ры генера­тив­ных моделей ИИ далеко не так прод­винуты, и нет ничего уди­витель­ного в том, что кор­рек­тно обра­ботать такой зап­рос они не смог­ли. Я же решил написать статью, которая, воз­можно, удер­жит тебя от изде­ватель­ств над искусс­твен­ным интеллек­том.

Пра­вила сос­тавле­ния зап­росов разитель­но отли­чают­ся в зависи­мос­ти от архи­тек­туры модели и исполь­зуемых в ней тек­сто­вых декоде­ров, а син­таксис — в зависи­мос­ти от исполь­зуемо­го для генера­ции соф­та. К при­меру, модели на осно­ве Flux луч­ше все­го работа­ют с тек­сто­выми зап­росами, сос­тавлен­ными дру­гим искусс­твен­ным интеллек­том — боль­шой язы­ковой моделью (нап­ример, ChatGPT). Язы­ковые модели уме­ют пра­виль­но струк­туриро­вать зап­рос, в резуль­тате чего кар­тинка получа­ется более деталь­ной и когерен­тной по срав­нению с корот­кими зап­росами, сос­тавлен­ными по пра­вилам моделей SDXL.

В качес­тве при­мера при­веду иллюс­тра­цию, которую модель Flux выдала с пер­вой или вто­рой попыт­ки.

В качес­тве зап­роса исполь­зовал­ся текст, сге­нери­рован­ный ChatGPT:

Title: Display the title "The Crazy Adventure of the Kung-Fu Chicken" in bold and playful text at the top or center of the poster.

Main Character: Depict a dynamic and charismatic ninja chicken in a heroic karate pose, wearing a traditional karate outfit, while still showing chicken features like feathers and a beak.

Background: Include a colorful and exciting backdrop with elements like a mystical forest, a bustling city, and an ancient temple to hint at various adventures. The background is vibrant and engaging.

Supporting Characters: Add a few quirky and fun supporting characters such as a wise old turtle, a mischievous squirrel sidekick, and a villainous fox.

Pixar Branding: Incorporate the Pixar logo at the bottom or top of the poster to establish it as an official Pixar movie.

Tagline: Include a tagline that reads: "A Kung-Fu Adventure" prominently on the poster.

Visual Style: Ensure the overall visual style is consistent with Pixar signature animation look: bright colors, expressive characters, and a touch of whimsy.