Root NationニュースITニュースGoogleのAIツールImagen 2が4秒の動画を作成できるようになった

GoogleのAIツールImagen 2が4秒の動画を作成できるようになった

-

Google には、人工知能による画像の作成に関しては大きな実績がありません。新たに スキャンダルが勃発した ジェミニに組み込まれている画像ジェネレーターが、人々の画像を誤って作成し、人種を間違えたためです。多くの苦情の後、ハイテク巨人は顔生成機能を削除し、「修理に」送りました。私たちが待っている間に、同社は Vertex AI 開発者プラットフォームの一部として改良された Imagen 2 イメージング ツールをリリースしました。ただし、微妙な点があります。このツールは依然としてビジネスに焦点を当てています。

Google イメージジェン 2

Imagen 2 は、DALL-E や Midjourney と同様に、テキスト プロンプトを使用して画像を作成および編集できます。このツールはテキスト、エンブレム、ロゴを複数の言語で表示でき、オプションでこれらの要素を名刺、衣服、製品などの既存の画像にオーバーレイできます。

最初にプレビュー モードで起動した後、Imagen 2 によるイメージ編集が Vertex AI で利用できるようになり、ペイントとカラーという つの新機能が追加されました。 DALL-E などの他の一般的な画像ジェネレーターによって長い間提供されてきたペイント機能とカラーリング機能を使用して、画像の不要な部分を削除し、新しいコンポーネントを追加し、画像の境界を拡張して、より幅広い領域を作成できます。ビュー。

でログイン

しかし、Imagen 2 の本当のアップグレードは次のとおりです。 でログイン 「テキストのライブ画像への変換」と呼ばれます。このツールは、AI を活用したクリップ メーカーと同様に、テキスト プロンプトから 4 秒のビデオを作成できるようになりました。モデルの企業の焦点に沿って、Google はマーケティング担当者やクリエイティブ向けのツールとして、自然、食べ物、動物を紹介する広告用の GIF ジェネレーターなどのライブ画像を提供しています。これは Imagen 2 が完璧に訓練されている主題です。

でログイン ライブ画像は「一貫性を維持しながら」「さまざまな角度や動き」を捉えることができると主張している。しかし今のところ、解像度は 360x640 と低く、同社はこれが将来的に改善されることを約束しました。

Googleは、ディープフェイクの可能性についての懸念を軽減するために、Imagen 2はGoogle DeepMindが開発した特別なSynthID技術を使用して、ライブ画像に目に見えない暗号透かしを適用すると述べた。これらは、圧縮、フィルター、色調調整などの編集には耐性がありますが、それらを検出するには別のツールが必要です。

また でログイン ライブ画像の生成は「セキュリティ目的でテストされる」と強調している。 「Vertex AI の Imagen 2 モデルでは、Gemini アプリケーションと同じ問題は発生しませんでした。私たちは引き続き積極的にテストし、顧客と対話していきます」と同社の代表者は述べています。

また読む:

ソースTechCrunchの
サインアップ
について通知する
ゲスト

0 コメント
埋め込まれたレビュー
すべてのコメントを表示