### What problem does this PR solve? Close #11433 ### Type of change - [x] New Feature (non-breaking change which adds functionality)
15 KiB
Dokumentasi | Peta Jalan | Twitter | Discord | Demo
📕 Daftar Isi
💡 Apa Itu RAGFlow?
RAGFlow adalah mesin RAG (Retrieval-Augmented Generation) open-source terkemuka yang mengintegrasikan teknologi RAG mutakhir dengan kemampuan Agent untuk menciptakan lapisan kontekstual superior bagi LLM. Menyediakan alur kerja RAG yang efisien dan dapat diadaptasi untuk perusahaan segala skala. Didukung oleh mesin konteks terkonvergensi dan template Agent yang telah dipra-bangun, RAGFlow memungkinkan pengembang mengubah data kompleks menjadi sistem AI kesetiaan-tinggi dan siap-produksi dengan efisiensi dan presisi yang luar biasa.
🎮 Demo
Coba demo kami di https://demo.ragflow.io.
🔥 Pembaruan Terbaru
- 2025-11-19 Mendukung Gemini 3 Pro.
- 2025-11-12 Mendukung sinkronisasi data dari Confluence, S3, Notion, Discord, Google Drive.
- 2025-10-23 Mendukung MinerU & Docling sebagai metode penguraian dokumen.
- 2025-10-15 Dukungan untuk jalur data yang terorkestrasi.
- 2025-08-08 Mendukung model seri GPT-5 terbaru dari OpenAI.
- 2025-08-01 Mendukung alur kerja agen dan MCP.
- 2025-05-23 Menambahkan komponen pelaksana kode Python/JS ke Agen.
- 2025-05-05 Mendukung kueri lintas bahasa.
- 2025-03-19 Mendukung penggunaan model multi-modal untuk memahami gambar di dalam file PDF atau DOCX.
- 2024-12-18 Meningkatkan model Analisis Tata Letak Dokumen di DeepDoc.
- 2024-08-22 Dukungan untuk teks ke pernyataan SQL melalui RAG.
🎉 Tetap Terkini
⭐️ Star repositori kami untuk tetap mendapat informasi tentang fitur baru dan peningkatan menarik! 🌟
🌟 Fitur Utama
🍭 "Kualitas Masuk, Kualitas Keluar"
- Ekstraksi pengetahuan berbasis pemahaman dokumen mendalam dari data tidak terstruktur dengan format yang rumit.
- Menemukan "jarum di tumpukan data" dengan token yang hampir tidak terbatas.
🍱 Pemotongan Berbasis Template
- Cerdas dan dapat dijelaskan.
- Banyak pilihan template yang tersedia.
🌱 Referensi yang Didasarkan pada Data untuk Mengurangi Hallusinasi
- Visualisasi pemotongan teks memungkinkan intervensi manusia.
- Tampilan cepat referensi kunci dan referensi yang dapat dilacak untuk mendukung jawaban yang didasarkan pada fakta.
🍔 Kompatibilitas dengan Sumber Data Heterogen
- Mendukung Word, slide, excel, txt, gambar, salinan hasil scan, data terstruktur, halaman web, dan banyak lagi.
🛀 Alur Kerja RAG yang Otomatis dan Mudah
- Orkestrasi RAG yang ramping untuk bisnis kecil dan besar.
- LLM yang dapat dikonfigurasi serta model embedding.
- Peringkat ulang berpasangan dengan beberapa pengambilan ulang.
- API intuitif untuk integrasi yang mudah dengan bisnis.
🔎 Arsitektur Sistem
🎬 Mulai
📝 Prasyarat
- CPU >= 4 inti
- RAM >= 16 GB
- Disk >= 50 GB
- Docker >= 24.0.0 & Docker Compose >= v2.26.1
- gVisor: Hanya diperlukan jika Anda ingin menggunakan fitur eksekutor kode (sandbox) dari RAGFlow.
Tip
Jika Anda belum menginstal Docker di komputer lokal Anda (Windows, Mac, atau Linux), lihat Install Docker Engine.
🚀 Menjalankan Server
-
Pastikan
vm.max_map_count>= 262144:Untuk memeriksa nilai
vm.max_map_count:$ sysctl vm.max_map_countJika nilainya kurang dari 262144, setel ulang
vm.max_map_countke setidaknya 262144:# Dalam contoh ini, kita atur menjadi 262144: $ sudo sysctl -w vm.max_map_count=262144Perubahan ini akan hilang setelah sistem direboot. Untuk membuat perubahan ini permanen, tambahkan atau perbarui nilai
vm.max_map_countdi /etc/sysctl.conf:vm.max_map_count=262144 -
Clone repositori:
$ git clone https://github.com/infiniflow/ragflow.git -
Bangun image Docker pre-built dan jalankan server:
Caution
Semua gambar Docker dibangun untuk platform x86. Saat ini, kami tidak menawarkan gambar Docker untuk ARM64. Jika Anda menggunakan platform ARM64, silakan gunakan panduan ini untuk membangun gambar Docker yang kompatibel dengan sistem Anda.
Perintah di bawah ini mengunduh edisi v0.22.1 dari gambar Docker RAGFlow. Silakan merujuk ke tabel berikut untuk deskripsi berbagai edisi RAGFlow. Untuk mengunduh edisi RAGFlow yang berbeda dari v0.22.1, perbarui variabel RAGFLOW_IMAGE di docker/.env sebelum menggunakan docker compose untuk memulai server.
$ cd ragflow/docker
# git checkout v0.22.1
# Opsional: gunakan tag stabil (lihat releases: https://github.com/infiniflow/ragflow/releases)
# This steps ensures the **entrypoint.sh** file in the code matches the Docker image version.
# Use CPU for DeepDoc tasks:
$ docker compose -f docker-compose.yml up -d
# To use GPU to accelerate DeepDoc tasks:
# sed -i '1i DEVICE=gpu' .env
# docker compose -f docker-compose.yml up -d
Catatan: Sebelum
v0.22.0, kami menyediakan image dengan model embedding dan image slim tanpa model embedding. Detailnya sebagai berikut:
| RAGFlow image tag | Image size (GB) | Has embedding models? | Stable? |
|---|---|---|---|
| v0.21.1 | ≈9 | ✔️ | Stable release |
| v0.21.1-slim | ≈2 | ❌ | Stable release |
Mulai dari
v0.22.0, kami hanya menyediakan edisi slim dan tidak lagi menambahkan akhiran -slim pada tag image.
-
Periksa status server setelah server aktif dan berjalan:
$ docker logs -f docker-ragflow-cpu-1Output berikut menandakan bahwa sistem berhasil diluncurkan:
____ ___ ______ ______ __ / __ \ / | / ____// ____// /____ _ __ / /_/ // /| | / / __ / /_ / // __ \| | /| / / / _, _// ___ |/ /_/ // __/ / // /_/ /| |/ |/ / /_/ |_|/_/ |_|\____//_/ /_/ \____/ |__/|__/ * Running on all addresses (0.0.0.0)Jika Anda melewatkan langkah ini dan langsung login ke RAGFlow, browser Anda mungkin menampilkan error
network anormalkarena RAGFlow mungkin belum sepenuhnya siap. -
Buka browser web Anda, masukkan alamat IP server Anda, dan login ke RAGFlow.
Dengan pengaturan default, Anda hanya perlu memasukkan
http://IP_DEVICE_ANDA(tanpa nomor port) karena port HTTP default80bisa dihilangkan saat menggunakan konfigurasi default. -
Dalam service_conf.yaml.template, pilih LLM factory yang diinginkan di
user_default_llmdan perbarui bidangAPI_KEYdengan kunci API yang sesuai.Lihat llm_api_key_setup untuk informasi lebih lanjut.
Sistem telah siap digunakan!
🔧 Konfigurasi
Untuk konfigurasi sistem, Anda perlu mengelola file-file berikut:
- .env: Menyimpan pengaturan dasar sistem, seperti
SVR_HTTP_PORT,MYSQL_PASSWORD, danMINIO_PASSWORD. - service_conf.yaml.template: Mengonfigurasi aplikasi backend.
- docker-compose.yml: Sistem ini bergantung pada docker-compose.yml untuk memulai.
Untuk memperbarui port HTTP default (80), buka docker-compose.yml dan ubah 80:80
menjadi <YOUR_SERVING_PORT>:80.
Pembaruan konfigurasi ini memerlukan reboot semua kontainer agar efektif:
$ docker compose -f docker-compose.yml up -d
🔧 Membangun Docker Image
Image ini berukuran sekitar 2 GB dan bergantung pada aplikasi LLM eksternal dan embedding.
git clone https://github.com/infiniflow/ragflow.git
cd ragflow/
docker build --platform linux/amd64 -f Dockerfile -t infiniflow/ragflow:nightly .
🔨 Menjalankan Aplikasi dari untuk Pengembangan
-
Instal
uvdanpre-commit, atau lewati langkah ini jika sudah terinstal:pipx install uv pre-commit -
Clone kode sumber dan instal dependensi Python:
git clone https://github.com/infiniflow/ragflow.git cd ragflow/ uv sync --python 3.10 # install RAGFlow dependent python modules uv run download_deps.py pre-commit install -
Jalankan aplikasi yang diperlukan (MinIO, Elasticsearch, Redis, dan MySQL) menggunakan Docker Compose:
docker compose -f docker/docker-compose-base.yml up -dTambahkan baris berikut ke
/etc/hostsuntuk memetakan semua host yang ditentukan di conf/service_conf.yaml ke127.0.0.1:127.0.0.1 es01 infinity mysql minio redis sandbox-executor-manager -
Jika Anda tidak dapat mengakses HuggingFace, atur variabel lingkungan
HF_ENDPOINTuntuk menggunakan situs mirror:export HF_ENDPOINT=https://hf-mirror.com -
Jika sistem operasi Anda tidak memiliki jemalloc, instal sebagai berikut:
# ubuntu sudo apt-get install libjemalloc-dev # centos sudo yum install jemalloc # mac sudo brew install jemalloc -
Jalankan aplikasi backend:
source .venv/bin/activate export PYTHONPATH=$(pwd) bash docker/launch_backend_service.sh -
Instal dependensi frontend:
cd web npm install -
Jalankan aplikasi frontend:
npm run devOutput berikut menandakan bahwa sistem berhasil diluncurkan:
-
Hentikan layanan front-end dan back-end RAGFlow setelah pengembangan selesai:
pkill -f "ragflow_server.py|task_executor.py"
📚 Dokumentasi
📜 Roadmap
Lihat Roadmap RAGFlow 2025
🏄 Komunitas
🙌 Kontribusi
RAGFlow berkembang melalui kolaborasi open-source. Dalam semangat ini, kami menerima kontribusi dari komunitas. Jika Anda ingin berpartisipasi, tinjau terlebih dahulu Panduan Kontribusi.


