Flux (model teks-ke-gambar)
| Flux | |
|---|---|
Gambar yang dihasilkan oleh Flux.1 Kontext Pro | |
| Penulis asli | Black Forest Labs |
| Pengembang | Black Forest Labs |
| Rilis awal | Agustus 2024 |
| Jenis | Model teks-ke-gambar |
| Lisensi |
|
| Situs web | blackforestlabs |
| Repositori | |
Flux (juga dikenal sebagai FLUX.1) adalah sebuah model teks-ke-gambar yang dikembangkan oleh Black Forest Labs, yang berpusat di Freiburg, Jerman. Seperti halnya model teks-ke-gambar lainnya, Flux menghasilkan gambar dari deskripsi bahasa alami, yang dikenal sebagai perintah (prompt).
Sejarah
Black Forest Labs (BFL) didirikan pada tahun 2024 oleh sejumlah mantan karyawan Stability AI yang terdiri dari Robin Rombach, Andreas Blattmann, dan Patrick Esser.[2][3] Ketiga pendiri sebelumnya terlibat dalam penelitian pembuatan gambar kecerdasan buatan di Universitas Ludwig Maximilian München sebagai asisten peneliti di bawah Björn Ommer.[4][5][6] Mereka menerbitkan hasil penelitiannya tentang pembuatan gambar pada tahun 2022, yang menghasilkan Stable Diffusion.[6][7] Pada bulan Agustus 2024, Flux diintegrasikan ke dalam chatbot Grok yang dikembangkan oleh xAI dan tersedia sebagai bagian dari fitur berbayar di X (sebelumnya dikenal sebagai Twitter).[8][9][10] Investor yang terlibat dalam Black Forest Labs diantaranya Andrerssen Horowitz, Brendan Iribe, Michael Ovitz, dan Garry Tan. Perusahaan menerima pendanaan awal sebesar US$ juta.[11][12]
Pada bulan Agustus 2024, Flux terintegrasi dengan bot percakapan Grok yang dikembangkan oleh xAI dan mulai tersedia sebagai fitur premium di X.[13][14][15][16] Grok lalu berpindah ke model teks-ke-gambar besutan xAI, Aurora pada bulan Desember 2024.[17]
Pada 18 November 2024, Mistral AI mengumumkan integrasi Flux Pro sebagai model teks-ke-gambar pada bot percakapan Le Chat.[18][19]
Pada 21 November 2024, BFL mengumumkan rilisnya Flux.1 Tools, sebuah kumpulan perangkat lunak untuk menyunting gambar yang dirancang untuk penggunaan pada model Flux. Kumpulan ini terdiri dari Flux.1 Fill untuk teknik inpainting (modifikasi dalam gambar) dan outpainting (modifikasi luar gambar, memperluas gambar), Flux.1 Depth untuk mengatur gambar berdasarkan teknik peta kedalaman dari perintah dan gambar masukan, Flux.1 Canny untuk mengatur gambar berdasarkan teknik ujung Canny, dan Flux.1 Redux untuk menggabungkan sekumpulan perintah dan gambar masukan menjadu keluaran baru. Setiap perangkat lunak tersedia dalam model Pro dan Dev.[20][21]
Pada bulan Januari 2025, BFL mengumumkan kerjasama dengan Nvidia untuk penggunaan Flux sebagai model landasan untuk mikroarsitektur Blackwell.[22] Perusahaan juga mengumumkan rilisnya Flux Pro Finetuning API, dirancang untuk modifikasi dan teknik fine-tuning pada gambar hasil ciptaan model Flux dan kerjasama dengan perusahaan media Jerman Hubert Burda Media dalam pengunaan model Flux Pro sebagai bagian dari pembuatan konten.[23]
Pada 29 Mei 2025, BFL mengumumkan rilisnya Flux.1 Kontext, sebuah kumpulan model yang memiliki kemampuan ciptaan gambar sesuai konteks, memungkinkan pengguna untuk menciptakan gambar dengan masukan perintah teks dan masukan gambar.[24][25] BFL Playground, sebuah antarmuka untuk ujicoba model Flux juga dirilis pada waktu yang sama.[24][25]
Model
- Kiri:: Gambar asli yang diciptakan dengan model AnimagineXL 4.0 (sebuah model teks-ke-gambar berbasis Stable Diffusion XL) dan dimodifikasi lebih lanjut dengan perangkat lunak Krita
- Kanan: Gambar hasil modifikasi yang diciptakan oleh Flux.1 Kontext Pro. Perubahan yang dibuat: Penambahan telinga serigala (kemonomimi), perubahan warna pada rambut, mata, penyuara jemala, jaket, kaos, celana, dan latar belakang.
Flux adalah serangkaian model teks-ke-gambar yang digunakan dalam seni kecerdasan buatan. Model ini didasarkan pada arsitektur campuran yang terdiri dari kombinasi blok transformator difusi multimodal dan paralel yang memiliki 12 miliar parameter.[26] Varian model tersebut dirilis dengan lisensi yang berbeda-beda, mulai dari Schnell (secara harfiah berarti Cepat dalam bahasa Jerman) dirilis sebagai perangkat lunak sumber terbuka di bawah Lisensi Apache, Dev dirilis sebagai perangkat lunak sumber tersedia di bawah lisensi non-komersial, dan Pro dirilis sebagai perangkat lunak milik perorangan dan hanya tersedia dalam bentuk API yang dapat dilisensikan oleh pihak ketiga.[27][28] Pengguna tetap memiliki kepemilikan atas hasil keluaran terlepas dari varian model yang digunakan.[29][30]
Model-model tersebut dapat digunakan secara daring atau lokal dengan menggunakan antarmuka pengguna kecerdasan buatan generatif seperti ComfyUI.[26]
Sebuah model unggulan yang disempurnakan, Flux 1.1 Pro dirilis pada tanggal 2 Oktober 2024.[31][32] Dua mode tambahan ditambahkan pada kemudian hari, yaitu Ultra yang dapat menghasilkan gambar dengan resolusi empat kali lebih tinggi dan hingga 4 megapiksel tanpa memengaruhi kecepatan pembuatan dan Raw yang dapat menghasilkan gambar hiper-realistis dalam gaya fotografi kejutan pada tanggal 6 November 2024.[33][34][35]
Flux.1 Kontext adalah sebuah seri dengan kemampuan ciptaan gambar sesuai konteks dan penyuntingan. Seri ini tersedia dalam model Pro, Max, dan Dev. Pro adalah model dengan kualitas tertinggi dan dapat digunakan untuk memodifikasi gambar yang sudah ada dengan menggunakan perintah teks secara bergiliran sedangkan Max adalah model yang berfokus pada kecepatan penciptaan.[36] Dev adalah sebuah model open-weight (beban terbuka) yang dirilis dengan lisensi non-komersial, sama seperti model Flux.1 Dev.[37]
Masih terkait dengan Flux yaitu model teks-ke-video SOTA, yang pada saat ini sedang dalam pengembangan.[26]
Tanggapan
Flux dikritik karena gambar yang dihasilkannya sangat realistis seperti foto yang dapat digunakan untuk pemalsuan dalam. Menurut laporan sejumlah media, penggambaran tersebut berkisar dari gambar Donald Trump berpose dengan senjata hingga adegan-adegan yang tidak layak, yang memicu diskusi tentang implikasi etis dari penggunaan Flux.[4][10]
Setelah model tersebut dirilis, media sosial X dibanjiri gambar yang dihasilkan Flux.[38][39] Black Forest Labs belum memberikan rincian pasti mengenai data yang digunakan untuk melatih Flux.[33] Ars Technica menduga bahwa Flux didasarkan pada kumpulan gambar besar yang digali dari internet, sebuah praktik kontroversial dengan konsekuensi hukum yang potensial.[40][41]
Menurut sebuah ujicoba yang dilakukan oleh situs web berita teknologi Jepang Gigazine terhadap Flux.1 Kontext, seri ini memiliki pemahaman terhadap bahasa Inggris yang baik dan dapat dengan mudah mengubah gaya gambar dari realistis menjadi gaya anime, sesuai dengan perintah yang diberikan oleh pengguna, tetapi pemahaman terhadap bahasa Jepang tidak begitu baik.[42]
Referensi
- ^ "FLUX.2: Frontier Visual Intelligence". Black Forest Labs. 2025-11-25. Diakses tanggal 2025-11-26.
- ^ Killian, Nicolas (2024-08-27). "Black Forest Labs: Sie sind ein Teil von jener Kraft". Die Zeit (dalam bahasa Jerman). ISSN 0044-2070. Diakses tanggal 2024-11-17.
- ^ Growcoot, Matt (2024-08-05). "AI Image Generator Made by Stable Diffusion Inventors on Par With Midjourney and DALL-E". PetaPixel (dalam bahasa Inggris). Diakses tanggal 2024-11-17.
- ^ a b "Black Forest Labs unter Beschuss: Schockierende KI-Bilder sorgen für…". AlleAktien (dalam bahasa Jerman). 2024-08-22. Diakses tanggal 2024-11-17.
- ^ "Black Forest Labs: KI-Tools aus dem Schwarzwald". trend.at (dalam bahasa Jerman). 2024-08-08. Diakses tanggal 2024-11-17.
- ^ a b "Black Forest Labs: Die Schwarzwald-KI, auf die Elon Musk setzt". capital.de (dalam bahasa Jerman). 2024-08-15. Diakses tanggal 2024-11-17.
- ^ "High-Resolution Image Synthesis with Latent Diffusion Models". Computer Vision & Learning Group (dalam bahasa American English). Diakses tanggal 2024-11-17.
- ^ meedia.de. "Generative AI. Black Forest Labs und Flux.1: Vom Superstar zum Buhmann in fünf Tagen". MEEDIA (dalam bahasa Jerman). Diakses tanggal 2024-11-17.
- ^ "Flux.1 – ein deutscher KI-Bildgenerator dreht mit Grok frei". Handelsblatt (dalam bahasa Jerman). Diakses tanggal 2024-11-17.
- ^ a b Weatherbed, Jess (2024-08-14). "xAI's new Grok-2 chatbots bring AI image generation to X". The Verge (dalam bahasa Inggris). Diakses tanggal 2024-11-17.
- ^ Steinschaden, Jakob (2024-08-12). "Black Forest Labs: 31 Mio. Dollar für Herausforderer von OpenAI und Midjourney". Trending Topics (dalam bahasa Jerman). Diakses tanggal 2024-11-17.
- ^ Nuñez, Michael (2024-08-01). "Stable Diffusion creators launch Black Forest Labs, secure $31M for FLUX.1 AI image generator". VentureBeat (dalam bahasa American English). Diakses tanggal 2024-11-17.
- ^ Puscher, Frank. "Generative AI. Black Forest Labs und Flux.1: Vom Superstar zum Buhmann in fünf Tagen". MEEDIA (dalam bahasa Jerman). Diarsipkan dari versi aslinya tanggal 27 September 2024. Diakses tanggal 2024-11-17.
- ^ Bomke, Luisa. "Flux.1 – ein deutscher KI-Bildgenerator dreht mit Grok frei". Handelsblatt (dalam bahasa Jerman). Diarsipkan dari versi aslinya tanggal 30 August 2024. Diakses tanggal 2024-11-17.
- ^ Weatherbed, Jess (2024-08-14). "xAI's new Grok-2 chatbots bring AI image generation to X". The Verge (dalam bahasa Inggris). Diarsipkan dari versi aslinya tanggal 17 November 2024. Diakses tanggal 2024-11-17.
- ^ Metz, Rachel (2024-08-21). "This Tiny Startup Is Helping Musk's Grok With Image Generation". Bloomberg News (dalam bahasa Inggris). Diakses tanggal 2024-11-19.
- ^ Davis, Wes (2024-12-07). "X gives Grok a new photorealistic AI image generator". The Verge (dalam bahasa Inggris). Diarsipkan dari versi aslinya tanggal 12 December 2024. Diakses tanggal 2024-12-10.
- ^ "Mistral has entered the chat". Mistral AI (dalam bahasa Inggris). 2024-11-18. Diakses tanggal 2024-12-11.
- ^ Franzen, Carl (2024-11-18). "Mistral unleashes Pixtral Large and upgrades Le Chat into full-on ChatGPT competitor". VentureBeat (dalam bahasa Inggris). Diakses tanggal 2024-12-11.
- ^ "Introducing FLUX.1 Tools". Black Forest Labs (dalam bahasa Inggris). 2024-11-21. Diarsipkan dari versi aslinya tanggal 26 November 2024. Diakses tanggal 2024-12-13.
- ^ Bastian, Matthias (2024-11-22). "Black Forest Labs expands FLUX.1 with four new AI tools for image editing". The Decoder (dalam bahasa Inggris). Diarsipkan dari versi aslinya tanggal 22 November 2024. Diakses tanggal 2024-12-15.
- ^ Takahashi, Dean (2025-01-07). "Nvidia unveils AI foundation models running on RTX AI PCs". VentureBeat (dalam bahasa Inggris). Diarsipkan dari versi aslinya tanggal 9 January 2025. Diakses tanggal 2025-01-19.
- ^ Franzen, Carl (2025-01-16). "You can now fine-tune your own version of AI image maker Flux with just 5 images". VentureBeat (dalam bahasa Inggris). Diarsipkan dari versi aslinya tanggal 24 January 2025. Diakses tanggal 2025-01-19.
- ^ a b "Introducing FLUX.1 Kontext and the BFL Playground". Black Forest Labs (dalam bahasa Inggris). 29 May 2025. Diakses tanggal 2025-06-10.
- ^ a b David, Emilia (2025-05-29). "FLUX.1 Kontext enables in-context image generation for enterprise AI pipelines". VentureBeat (dalam bahasa Inggris). Diarsipkan dari versi aslinya tanggal 2 June 2025. Diakses tanggal 2025-06-10.
- ^ a b c "Announcing Black Forest Labs". Black Forest Labs (dalam bahasa American English). 2024-08-01. Diakses tanggal 2024-11-17.
- ^ "Get Flux". Black Forest Labs (dalam bahasa American English). Diakses tanggal 2024-11-17.
- ^ Wiggers, Kyle (2024-10-03). "Black Forest Labs, the startup behind Grok's image generator, releases an API". TechCrunch (dalam bahasa American English). Diakses tanggal 2024-11-17.
- ^ "flux/model_licenses/LICENSE-FLUX1-dev at main · black-forest-labs/flux". GitHub (dalam bahasa Inggris). Diakses tanggal 2024-11-18.
Outputs. We claim no ownership rights in and to the Outputs. You are solely responsible for the Outputs you generate and their subsequent uses in accordance with this License. You may use Output for any purpose (including for commercial purposes), except as expressly prohibited herein. You may not use the Output to train, fine-tune or distill a model that is competitive with the FLUX.1 [dev] Model.
- ^ "API Agreement - BFL Docs (Pro)". Black Forest Labs. 2024-08-01. Diakses tanggal 2024-11-18.
Output. Company claims no ownership rights in and to the Outputs, and Developer and Users may use the Output for their own personal or commercial purposes, subject to any restrictions set forth herein or in the Flux Service Terms. For the avoidance of doubt, Outputs do not include any components of the Flux API or the Flux AI model, such as its weights or parameters.
- ^ "Announcing FLUX1.1 [pro] and the BFL API". Black Forest Labs. 2 October 2024. Diakses tanggal 2024-11-17.
- ^ Franzen, Carl (2024-10-03). "Black Forest Labs releases Flux 1.1 Pro and an API". VentureBeat (dalam bahasa American English). Diakses tanggal 2024-11-17.
- ^ a b Growcoot, Matt (2024-11-07). "Flux AI Introduces Raw Mode That 'Captures the Genuine Feel of Candid Photography'". PetaPixel (dalam bahasa Inggris). Diakses tanggal 2024-11-19.
- ^ Bastian, Matthias (2024-11-06). "Flux 1.1 Pro AI image model adds "amateur" RAW photo mode and 4K image generation". The Decoder (dalam bahasa American English). Diakses tanggal 2024-11-17.
- ^ "Introducing FLUX1.1 [pro] Ultra and Raw Modes". Black Forest Labs (dalam bahasa American English). 2024-11-06. Diakses tanggal 2024-11-17.
- ^ "Introducing FLUX.1 Kontext and the BFL Playground". Black Forest Labs. 29 May 2025. Diakses tanggal 2025-06-10.
- ^ "FLUX.1 Kontext [dev] - Open Weights for Image Editing". Black Forest Labs (dalam bahasa Inggris). 2025-06-26. Diarsipkan dari versi aslinya tanggal 2025-06-28. Diakses tanggal 2025-06-27.
- ^ Zeff, Maxwell (2024-08-14). "Meet Black Forest Labs, the startup powering Elon Musk's unhinged AI image generator". TechCrunch (dalam bahasa American English). Diakses tanggal 2024-11-17.
- ^ Schwarzer, Matthias (2024-08-16). "Drogen, Bomben und Gewalt: KI-Bildgenerator von Elon Musk zeigt alles – mit deutscher Technik". RND.de (dalam bahasa Jerman). Diakses tanggal 2024-11-17.
- ^ Künne, Christoph (2024-08-07). "FLUX.1: Neuer KI-Bildgenerator". DOCMA (dalam bahasa Jerman). Diakses tanggal 2024-11-17.
- ^ Edwards, Benj (2024-08-02). "FLUX: This new AI image generator is eerily good at creating human hands". Ars Technica (dalam bahasa American English). Diakses tanggal 2024-11-17.
- ^ "I tried using the high-quality and high-speed image generation AI 'FLUX.1 Kontext', which supports text and image input and can generate both anime-style and live-action-style images". GIGAZINE (dalam bahasa Inggris). 2025-05-30. Diakses tanggal 2025-06-13.
Pranala luar
Konten ini disalin dari wikipedia, mohon digunakan dengan bijak.


