Files
ragflow/README_id.md
Kevin Hu 249296e417 Feat: API supports toc_enhance. (#11437)
### What problem does this PR solve?

Close #11433

### Type of change

- [x] New Feature (non-breaking change which adds functionality)
2025-11-21 14:51:58 +08:00

15 KiB
Raw Blame History

README in English 简体中文版自述文件 繁體中文版自述文件 日本語のREADME 한국어 Bahasa Indonesia Português(Brasil)

Ikuti di X (Twitter) Lencana Daring docker pull infiniflow/ragflow:v0.22.1 Rilis Terbaru Lisensi Ask DeepWiki

Dokumentasi | Peta Jalan | Twitter | Discord | Demo

infiniflow%2Fragflow | Trendshift
📕 Daftar Isi

💡 Apa Itu RAGFlow?

RAGFlow adalah mesin RAG (Retrieval-Augmented Generation) open-source terkemuka yang mengintegrasikan teknologi RAG mutakhir dengan kemampuan Agent untuk menciptakan lapisan kontekstual superior bagi LLM. Menyediakan alur kerja RAG yang efisien dan dapat diadaptasi untuk perusahaan segala skala. Didukung oleh mesin konteks terkonvergensi dan template Agent yang telah dipra-bangun, RAGFlow memungkinkan pengembang mengubah data kompleks menjadi sistem AI kesetiaan-tinggi dan siap-produksi dengan efisiensi dan presisi yang luar biasa.

🎮 Demo

Coba demo kami di https://demo.ragflow.io.

🔥 Pembaruan Terbaru

  • 2025-11-19 Mendukung Gemini 3 Pro.
  • 2025-11-12 Mendukung sinkronisasi data dari Confluence, S3, Notion, Discord, Google Drive.
  • 2025-10-23 Mendukung MinerU & Docling sebagai metode penguraian dokumen.
  • 2025-10-15 Dukungan untuk jalur data yang terorkestrasi.
  • 2025-08-08 Mendukung model seri GPT-5 terbaru dari OpenAI.
  • 2025-08-01 Mendukung alur kerja agen dan MCP.
  • 2025-05-23 Menambahkan komponen pelaksana kode Python/JS ke Agen.
  • 2025-05-05 Mendukung kueri lintas bahasa.
  • 2025-03-19 Mendukung penggunaan model multi-modal untuk memahami gambar di dalam file PDF atau DOCX.
  • 2024-12-18 Meningkatkan model Analisis Tata Letak Dokumen di DeepDoc.
  • 2024-08-22 Dukungan untuk teks ke pernyataan SQL melalui RAG.

🎉 Tetap Terkini

Star repositori kami untuk tetap mendapat informasi tentang fitur baru dan peningkatan menarik! 🌟

🌟 Fitur Utama

🍭 "Kualitas Masuk, Kualitas Keluar"

  • Ekstraksi pengetahuan berbasis pemahaman dokumen mendalam dari data tidak terstruktur dengan format yang rumit.
  • Menemukan "jarum di tumpukan data" dengan token yang hampir tidak terbatas.

🍱 Pemotongan Berbasis Template

  • Cerdas dan dapat dijelaskan.
  • Banyak pilihan template yang tersedia.

🌱 Referensi yang Didasarkan pada Data untuk Mengurangi Hallusinasi

  • Visualisasi pemotongan teks memungkinkan intervensi manusia.
  • Tampilan cepat referensi kunci dan referensi yang dapat dilacak untuk mendukung jawaban yang didasarkan pada fakta.

🍔 Kompatibilitas dengan Sumber Data Heterogen

  • Mendukung Word, slide, excel, txt, gambar, salinan hasil scan, data terstruktur, halaman web, dan banyak lagi.

🛀 Alur Kerja RAG yang Otomatis dan Mudah

  • Orkestrasi RAG yang ramping untuk bisnis kecil dan besar.
  • LLM yang dapat dikonfigurasi serta model embedding.
  • Peringkat ulang berpasangan dengan beberapa pengambilan ulang.
  • API intuitif untuk integrasi yang mudah dengan bisnis.

🔎 Arsitektur Sistem

🎬 Mulai

📝 Prasyarat

  • CPU >= 4 inti
  • RAM >= 16 GB
  • Disk >= 50 GB
  • Docker >= 24.0.0 & Docker Compose >= v2.26.1
  • gVisor: Hanya diperlukan jika Anda ingin menggunakan fitur eksekutor kode (sandbox) dari RAGFlow.

Tip

Jika Anda belum menginstal Docker di komputer lokal Anda (Windows, Mac, atau Linux), lihat Install Docker Engine.

🚀 Menjalankan Server

  1. Pastikan vm.max_map_count >= 262144:

    Untuk memeriksa nilai vm.max_map_count:

    $ sysctl vm.max_map_count
    

    Jika nilainya kurang dari 262144, setel ulang vm.max_map_count ke setidaknya 262144:

    # Dalam contoh ini, kita atur menjadi 262144:
    $ sudo sysctl -w vm.max_map_count=262144
    

    Perubahan ini akan hilang setelah sistem direboot. Untuk membuat perubahan ini permanen, tambahkan atau perbarui nilai vm.max_map_count di /etc/sysctl.conf:

    vm.max_map_count=262144
    
  2. Clone repositori:

    $ git clone https://github.com/infiniflow/ragflow.git
    
  3. Bangun image Docker pre-built dan jalankan server:

Caution

Semua gambar Docker dibangun untuk platform x86. Saat ini, kami tidak menawarkan gambar Docker untuk ARM64. Jika Anda menggunakan platform ARM64, silakan gunakan panduan ini untuk membangun gambar Docker yang kompatibel dengan sistem Anda.

Perintah di bawah ini mengunduh edisi v0.22.1 dari gambar Docker RAGFlow. Silakan merujuk ke tabel berikut untuk deskripsi berbagai edisi RAGFlow. Untuk mengunduh edisi RAGFlow yang berbeda dari v0.22.1, perbarui variabel RAGFLOW_IMAGE di docker/.env sebelum menggunakan docker compose untuk memulai server.

   $ cd ragflow/docker
   
   # git checkout v0.22.1
   # Opsional: gunakan tag stabil (lihat releases: https://github.com/infiniflow/ragflow/releases)
   # This steps ensures the **entrypoint.sh** file in the code matches the Docker image version.

   # Use CPU for DeepDoc tasks:
   $ docker compose -f docker-compose.yml up -d

   # To use GPU to accelerate DeepDoc tasks:
   # sed -i '1i DEVICE=gpu' .env
   # docker compose -f docker-compose.yml up -d

Catatan: Sebelum v0.22.0, kami menyediakan image dengan model embedding dan image slim tanpa model embedding. Detailnya sebagai berikut:

RAGFlow image tag Image size (GB) Has embedding models? Stable?
v0.21.1 ≈9 ✔️ Stable release
v0.21.1-slim ≈2 Stable release

Mulai dari v0.22.0, kami hanya menyediakan edisi slim dan tidak lagi menambahkan akhiran -slim pada tag image.

  1. Periksa status server setelah server aktif dan berjalan:

    $ docker logs -f docker-ragflow-cpu-1
    

    Output berikut menandakan bahwa sistem berhasil diluncurkan:

    
          ____   ___    ______ ______ __
         / __ \ /   |  / ____// ____// /____  _      __
        / /_/ // /| | / / __ / /_   / // __ \| | /| / /
       / _, _// ___ |/ /_/ // __/  / // /_/ /| |/ |/ /
      /_/ |_|/_/  |_|\____//_/    /_/ \____/ |__/|__/
    
     * Running on all addresses (0.0.0.0)
    

    Jika Anda melewatkan langkah ini dan langsung login ke RAGFlow, browser Anda mungkin menampilkan error network anormal karena RAGFlow mungkin belum sepenuhnya siap.

  2. Buka browser web Anda, masukkan alamat IP server Anda, dan login ke RAGFlow.

    Dengan pengaturan default, Anda hanya perlu memasukkan http://IP_DEVICE_ANDA (tanpa nomor port) karena port HTTP default 80 bisa dihilangkan saat menggunakan konfigurasi default.

  3. Dalam service_conf.yaml.template, pilih LLM factory yang diinginkan di user_default_llm dan perbarui bidang API_KEY dengan kunci API yang sesuai.

    Lihat llm_api_key_setup untuk informasi lebih lanjut.

    Sistem telah siap digunakan!

🔧 Konfigurasi

Untuk konfigurasi sistem, Anda perlu mengelola file-file berikut:

Untuk memperbarui port HTTP default (80), buka docker-compose.yml dan ubah 80:80 menjadi <YOUR_SERVING_PORT>:80.

Pembaruan konfigurasi ini memerlukan reboot semua kontainer agar efektif:

$ docker compose -f docker-compose.yml up -d

🔧 Membangun Docker Image

Image ini berukuran sekitar 2 GB dan bergantung pada aplikasi LLM eksternal dan embedding.

git clone https://github.com/infiniflow/ragflow.git
cd ragflow/
docker build --platform linux/amd64 -f Dockerfile -t infiniflow/ragflow:nightly .

🔨 Menjalankan Aplikasi dari untuk Pengembangan

  1. Instal uv dan pre-commit, atau lewati langkah ini jika sudah terinstal:

    pipx install uv pre-commit
    
  2. Clone kode sumber dan instal dependensi Python:

    git clone https://github.com/infiniflow/ragflow.git
    cd ragflow/
    uv sync --python 3.10 # install RAGFlow dependent python modules
    uv run download_deps.py
    pre-commit install
    
  3. Jalankan aplikasi yang diperlukan (MinIO, Elasticsearch, Redis, dan MySQL) menggunakan Docker Compose:

    docker compose -f docker/docker-compose-base.yml up -d
    

    Tambahkan baris berikut ke /etc/hosts untuk memetakan semua host yang ditentukan di conf/service_conf.yaml ke 127.0.0.1:

    127.0.0.1       es01 infinity mysql minio redis sandbox-executor-manager
    
  4. Jika Anda tidak dapat mengakses HuggingFace, atur variabel lingkungan HF_ENDPOINT untuk menggunakan situs mirror:

    export HF_ENDPOINT=https://hf-mirror.com
    
  5. Jika sistem operasi Anda tidak memiliki jemalloc, instal sebagai berikut:

    # ubuntu
    sudo apt-get install libjemalloc-dev
    # centos
    sudo yum install jemalloc
    # mac
    sudo brew install jemalloc
    
  6. Jalankan aplikasi backend:

    source .venv/bin/activate
    export PYTHONPATH=$(pwd)
    bash docker/launch_backend_service.sh
    
  7. Instal dependensi frontend:

    cd web
    npm install
    
  8. Jalankan aplikasi frontend:

    npm run dev
    

    Output berikut menandakan bahwa sistem berhasil diluncurkan:

  9. Hentikan layanan front-end dan back-end RAGFlow setelah pengembangan selesai:

    pkill -f "ragflow_server.py|task_executor.py"
    

📚 Dokumentasi

📜 Roadmap

Lihat Roadmap RAGFlow 2025

🏄 Komunitas

🙌 Kontribusi

RAGFlow berkembang melalui kolaborasi open-source. Dalam semangat ini, kami menerima kontribusi dari komunitas. Jika Anda ingin berpartisipasi, tinjau terlebih dahulu Panduan Kontribusi.