huggingface/aisheetsView GitHub Homepage for Latest Official Releases
أداة لمعالجة بيانات الذكاء الاصطناعي بدون تعليمات برمجية، تتيح بناء مجموعات البيانات وإثرائها وتحويلها باستخدام نماذج الذكاء الاصطناعي.
TypeScriptaisheetshuggingface 114 Last Updated: August 08, 2025
AI Sheets - أداة معالجة بيانات الذكاء الاصطناعي بدون تعليمات برمجية
نظرة عامة على المشروع
AI Sheets هي أداة بدون تعليمات برمجية مفتوحة المصدر من Hugging Face، مصممة خصيصًا لبناء وإثراء وتحويل مجموعات البيانات باستخدام نماذج الذكاء الاصطناعي. يمكن نشر الأداة محليًا أو تشغيلها على Hub، وتدعم الوصول إلى آلاف النماذج مفتوحة المصدر على Hugging Face Hub.
عنوان المشروع: https://github.com/huggingface/aisheets تجربة عبر الإنترنت: https://huggingface.co/spaces/aisheets/sheets
الميزات الأساسية
1. واجهة سهلة الاستخدام
- واجهة مستخدم سهلة التعلم تشبه جداول البيانات
- تدعم التجربة السريعة، بدءًا من مجموعات البيانات الصغيرة، ثم تشغيل مسارات توليد البيانات على نطاق واسع
- إنشاء أعمدة جديدة عن طريق كتابة المطالبات، مع إمكانية التكرار والتحرير اللانهائي للخلايا
2. تكامل قوي للذكاء الاصطناعي
- تدعم استخدام آلاف النماذج مفتوحة المصدر على Hugging Face Hub
- تدعم الاستدلال عبر Inference Providers API أو النماذج المحلية
- تدعم نماذج OpenAI gpt-oss
- تدعم نقاط نهاية LLM المخصصة (يجب أن تتوافق مع مواصفات OpenAI API)
3. عمليات بيانات متنوعة
- اختبار مقارنة النماذج: اختبار أداء نماذج مختلفة على نفس البيانات
- تحسين المطالبات: تحسين المطالبات لبيانات ونماذج محددة
- تحويل البيانات: تنظيف وتحويل أعمدة مجموعة البيانات
- تصنيف البيانات: تصنيف المحتوى تلقائيًا
- تحليل البيانات: استخراج المعلومات الرئيسية من النص
- إثراء البيانات: استكمال المعلومات المفقودة (مثل الرمز البريدي للعنوان)
- توليد البيانات الاصطناعية: إنشاء مجموعات بيانات واقعية ولكن خيالية
البنية التقنية
حزمة التقنيات الأمامية (Frontend)
- الإطار: Qwik + QwikCity
- أداة البناء: Vite
- إدارة الحزم: pnpm
هيكل الدليل
├── public/ # الأصول الثابتة
└── src/
├── components/ # المكونات عديمة الحالة
├── features/ # مكونات منطق الأعمال
└── routes/ # ملفات التوجيه
خدمات الواجهة الخلفية (Backend)
- الخادم: Express.js
- المصادقة: Hugging Face OAuth
- واجهة برمجة التطبيقات (API): متوافقة مع مواصفات OpenAI API
التثبيت والنشر
نشر Docker (موصى به)
# الحصول على رمز Hugging Face
export HF_TOKEN=your_token_here
# تشغيل حاوية Docker
docker run -p 3000:3000 \
-e HF_TOKEN=HF_TOKEN \
AI Sheets/sheets
# الوصول إلى http://localhost:3000
التطوير المحلي
# تثبيت pnpm
# استنساخ المشروع
git clone https://github.com/huggingface/aisheets.git
cd aisheets
# إعداد متغيرات البيئة
export HF_TOKEN=your_token_here
# تثبيت التبعيات
pnpm install
# بدء خادم التطوير
pnpm dev
# الوصول إلى http://localhost:5173
بناء الإنتاج
# بناء نسخة الإنتاج
pnpm build
# بدء خادم الإنتاج
export HF_TOKEN=your_token_here
pnpm serve
تهيئة متغيرات البيئة
التكوين الأساسي
HF_TOKEN
: رمز مصادقة Hugging FaceOAUTH_CLIENT_ID
: معرف عميل Hugging Face OAuthOAUTH_SCOPES
: نطاق مصادقة OAuth (افتراضي:openid profile inference-api manage-repos
)
تكوين النموذج
DEFAULT_MODEL
: نموذج توليد النص الافتراضي (افتراضي:meta-llama/Llama-3.3-70B-Instruct
)DEFAULT_MODEL_PROVIDER
: مزود النموذج الافتراضي (افتراضي:nebius
)MODEL_ENDPOINT_URL
: عنوان URL لنقطة نهاية الاستدلال المخصصةMODEL_ENDPOINT_NAME
: اسم النموذج المقابل لنقطة النهاية المخصصة
تكوين النظام
DATA_DIR
: دليل تخزين البيانات (افتراضي:./data
)NUM_CONCURRENT_REQUESTS
: عدد الطلبات المتزامنة (افتراضي: 5، الحد الأقصى: 10)SERPER_API_KEY
: مفتاح Serper API للبحث على الويبTELEMETRY_ENABLED
: مفتاح تشغيل/إيقاف وظيفة القياس عن بعد (افتراضي: 1)
طرق الاستخدام
1. طرق استيراد البيانات
إنشاء مجموعة بيانات من الصفر
- مناسب لـ: التعرف على الأداة، العصف الذهني، التجارب السريعة
- صف مجموعة البيانات التي تريدها، وسيقوم الذكاء الاصطناعي بتوليد الهيكل والمحتوى تلقائيًا
- مثال:
"مدن حول العالم، بما في ذلك البلد الذي تنتمي إليه وصور معالم كل مدينة، تم إنشاؤها بأسلوب جيبلي"
استيراد مجموعة بيانات موجودة (موصى به)
- التنسيقات المدعومة: XLS، TSV، CSV، Parquet
- ما يصل إلى 1000 صف، وعدد غير محدود من الأعمدة
- مناسب لمعظم سيناريوهات معالجة البيانات الواقعية
2. عمليات معالجة البيانات
إضافة عمود AI
انقر على زر "+" لإضافة عمود جديد، يمكنك اختيار:
- استخراج معلومات محددة
- تلخيص النصوص الطويلة
- ترجمة المحتوى
- مطالبة مخصصة:
"تنفيذ عملية معينة على {{column}}"
التحسين والتوسيع
- إضافة المزيد من الخلايا: اسحب لأسفل للتوليد التلقائي
- التحرير اليدوي: تحرير محتوى الخلية مباشرة كمثال
- آلية التغذية الراجعة: استخدم الإعجاب لتمييز المخرجات الجيدة
- تعديل التكوين: تعديل المطالبة، تبديل النموذج أو المزود
3. التصدير والتوسيع
- التصدير إلى Hugging Face Hub
- توليد ملفات تكوين قابلة لإعادة الاستخدام
- دعم HF Jobs لتوليد البيانات بكميات كبيرة
تكامل Ollama
# بدء خادم Ollama
export OLLAMA_NOHISTORY=1
ollama serve
ollama run llama3
# إعداد متغيرات البيئة
export MODEL_ENDPOINT_URL=http://localhost:11434
export MODEL_ENDPOINT_NAME=llama3
# بدء AI Sheets
pnpm serve
أمثلة على حالات الاستخدام
اختبار مقارنة النماذج
- استيراد مجموعة بيانات تحتوي على أسئلة
- إنشاء أعمدة مختلفة لنماذج مختلفة
- استخدام LLM كحكم لمقارنة جودة النماذج
تصنيف مجموعة البيانات
- استيراد مجموعة بيانات موجودة من Hub
- إضافة عمود تصنيف لتصنيف المحتوى
- التحقق اليدوي وتعديل نتائج التصنيف الأولية
مقارنة توليد الصور
- إنشاء مجموعة بيانات لأسماء الكائنات والأوصاف
- استخدام نماذج مختلفة لتوليد الصور
- مقارنة تأثير الأنماط والمطالبات المختلفة
مزايا المشروع
- عمليات بدون تعليمات برمجية: لا حاجة لمعرفة برمجية لمعالجة البيانات المعقدة
- مفتوح المصدر ومجاني: مفتوح المصدر بالكامل، يدعم النشر المحلي
- نماذج غنية: يتصل بالنظام البيئي لـ Hugging Face
- واجهة سهلة الاستخدام: تجربة تشغيل مألوفة تشبه Excel
- توسيع مرن: يدعم النماذج المخصصة ونقاط نهاية API
- تغذية راجعة في الوقت الفعلي: تحسين مخرجات الذكاء الاصطناعي من خلال التحرير والإعجاب
- معالجة مجمعة: يدعم مسارات توليد البيانات على نطاق واسع
المجتمع والدعم
- مستودع GitHub: https://github.com/huggingface/aisheets
- المجتمع عبر الإنترنت: https://huggingface.co/spaces/aisheets/sheets/discussions
- الإبلاغ عن المشكلات: عبر GitHub Issues
- الوثائق التقنية: أدلة مفصلة لتكوين البيئة وتكامل API
AI Sheets يوفر لعلماء البيانات والباحثين والمطورين أداة قوية وسهلة الاستخدام، مما يجعل معالجة بيانات الذكاء الاصطناعي بسيطة وفعالة. سواء كان الأمر يتعلق باختبار النماذج، أو تنظيف البيانات، أو توليد البيانات الاصطناعية، يمكن إنجاز كل ذلك بسرعة من خلال واجهة بديهية.