Home
Login

Milvus هي قاعدة بيانات متجهات مفتوحة المصدر وعالية الأداء وأصلية سحابيًا، مصممة للبحث عن التشابه المتجهي واسع النطاق لتطبيقات الذكاء الاصطناعي والذكاء الاصطناعي التوليدي.

Apache-2.0Go 35.5kmilvus-io Last Updated: 2025-06-20

نظرة عامة على مشروع Milvus

Milvus هو قاعدة بيانات متجهات مفتوحة المصدر عالية الأداء وأصلية سحابيًا، مصممة خصيصًا للبحث عن التشابه المتجه على نطاق واسع لتطبيقات الذكاء الاصطناعي والذكاء الاصطناعي التوليدي (GenAI). باعتبارها قاعدة بيانات متجهات مفتوحة المصدر مصممة خصيصًا لتطبيقات GenAI، يمكن لـ Milvus التعامل مع البحث عن المتجهات على مستوى المليارات مع الحفاظ على الحد الأدنى من فقدان الأداء.

الميزات الأساسية

1. خوارزميات بحث عالية الأداء

يدعم Milvus مجموعة واسعة من خوارزميات الفهرسة/البحث في الذاكرة والقرص، بما في ذلك IVF و HNSW و DiskANN وما إلى ذلك، وقد تم تحسين جميع الخوارزميات بعمق. بالمقارنة مع التطبيقات الشائعة مثل FAISS و HNSWLib، فإن Milvus يحسن الأداء بنسبة 30٪ -70٪.

2. بنية موزعة

تتبنى Milvus بنية موزعة تفصل بين الحساب والتخزين، والتي يمكن توسيعها أفقيًا والتكيف مع أنماط حركة المرور المختلفة، وتحقيق الأداء الأمثل عن طريق إضافة عقد استعلام بشكل مستقل للتعامل مع أحمال العمل المكثفة للقراءة، وإضافة عقد بيانات للتعامل مع أحمال العمل المكثفة للكتابة.

3. تصميم أصلي سحابيًا

بناءً على بنية الخدمات المصغرة عديمة الحالة المستندة إلى Kubernetes، يمكنها التعافي بسرعة من حالات الفشل، مما يضمن توافرًا عاليًا.

4. دعم أنواع بيانات متعددة

يدعم Milvus أنواع المتجهات الثنائية و Float32 و Float16 و BFloat16، لتلبية احتياجات سيناريوهات التطبيقات المختلفة.

البنية التقنية

تصميم نظام موزع

تتبنى Milvus بنية الخدمات المصغرة، وتشمل المكونات الرئيسية ما يلي:

  • المنسق: مسؤول عن موازنة التحميل وإدارة البيانات
  • عقد الاستعلام: معالجة أحمال العمل المكثفة للقراءة
  • عقد البيانات: معالجة أحمال العمل المكثفة للكتابة
  • عقد الفهرس: بناء وصيانة فهارس المتجهات

مستوى الاتساق

يدعم Milvus أربعة مستويات من اتساق البيانات، بما في ذلك الاتساق القوي والاتساق النهائي.

طرق النشر

يمكن نشر Milvus كقاعدة بيانات مضمنة أو خادم مستقل أو مجموعة موزعة. في الوقت نفسه، يمكن استخدام Milvus بالكامل في السحابة من خلال Zilliz Cloud، وهي منصة تعمل على تحسين تكاليف التشغيل وسرعة البحث عن المتجهات من خلال أربع وظائف متقدمة: المجموعات المنطقية، وفصل البيانات المتدفقة والتاريخية، والتخزين المتدرج، والتوسع التلقائي، والفصل البارد والساخن متعدد المستأجرين.

سيناريوهات التطبيق

1. الاسترجاع المعزز للتوليد (RAG)

Milvus مثالي لبناء أنظمة RAG، وقادر على إدارة والبحث في مجموعات المتجهات واسعة النطاق، والتعامل مع مجموعات البيانات واسعة النطاق التي تحتوي على مليارات الإدخالات.

2. أنظمة التوصية

محرك توصية شخصي يعتمد على تشابه المتجهات.

3. البحث عن الصور والفيديو

يدعم البحث عن التشابه في محتوى الوسائط المتعددة.

4. معالجة اللغة الطبيعية

البحث الدلالي عن النص واسترجاع المستندات.

بداية سريعة

التثبيت والاستخدام الأساسي

from pymilvus import MilvusClient


client = MilvusClient("milvus_demo.db")


client.create_collection(
    collection_name="demo_collection",
    dimension=768  
)

التكامل مع الأطر الأخرى

يوفر Milvus دعم التكامل مع أطر الذكاء الاصطناعي الرئيسية:

  • LangChain: سلسلة أدوات كاملة لبناء تطبيقات RAG
  • LlamaIndex: تكامل إطار بيانات ذكي
  • Haystack: خط أنابيب معالجة اللغة الطبيعية

مزايا الأداء

Milvus هي قاعدة بيانات متجهات مفتوحة المصدر مصممة لتعزيز البحث عن التشابه المضمن ودعم تطبيقات الذكاء الاصطناعي. إنها أداة رائدة تعمل على إضفاء الطابع الديمقراطي على البحث عن البيانات غير المنظمة، مما يضمن تجربة مستخدم موحدة عبر بيئات نشر مختلفة.

ميزات قابلية التوسع

  • يدعم التوسع الأفقي
  • معالجة بيانات المتجهات على مستوى المليارات
  • دعم متعدد المستأجرين
  • تصميم معماري مرن

الفرق عن قواعد البيانات التقليدية

تم تصميم Milvus من البداية كقاعدة بيانات متجهات، مما يوفر واجهات برمجة تطبيقات أكثر سهولة، ومجموعة واسعة من طرق الفهرسة ودعم مقاييس المسافة، وإمكانات استعلام تشبه SQL، مما يسلط الضوء على مزاياها في إدارة واستعلام البيانات غير المنظمة.

ملخص

باعتبارها قاعدة بيانات متجهات مصممة خصيصًا لعصر الذكاء الاصطناعي، تتمتع Milvus بمزايا كبيرة في معالجة بيانات المتجهات واسعة النطاق ودعم تطبيقات الذكاء الاصطناعي المعقدة. إن بنيتها الموزعة وخوارزمياتها عالية الأداء وتصميمها الأصلي السحابي تجعلها خيارًا مثاليًا لبناء تطبيقات الذكاء الاصطناعي الحديثة، خاصة في مجالات مثل RAG وأنظمة التوصية والبحث عن التشابه.