نظرة عامة على المشروع
SQLFlow هو مُترجم يقوم بتحويل برامج SQL إلى مهام سير عمل تعمل على Kubernetes. يقوم بتوسيع بناء جملة SQL لدعم مهام الذكاء الاصطناعي، بما في ذلك التدريب والتنبؤ وتقييم النماذج وتفسير النماذج والمهام المخصصة والتخطيط الرياضي.
عنوان المشروع: https://github.com/sql-machine-learning/sqlflow
يعالج SQLFlow نقاط الضعف في تطوير التعلم الآلي التقليدي:
يمكّن SQLFlow المهندسين ذوي مهارات SQL من تطوير تطبيقات ML متقدمة.
أنظمة قواعد البيانات المدعومة:
أطر عمل التعلم الآلي المدعومة:
يقوم SQLFlow بتوسيع بناء جملة SQL القياسي، ويضيف كلمات رئيسية وعبارات متعلقة بالتعلم الآلي، مما يمكّن المستخدمين من إجراء ما يلي مباشرة في SQL:
TO TRAIN
)TO PREDICT
)SELECT *
FROM iris.train
TO TRAIN DNNClassifier
WITH model.n_classes = 3, model.hidden_units = [10, 20]
COLUMN sepal_length, sepal_width, petal_length, petal_width
LABEL class
INTO sqlflow_models.my_dnn_model;
SELECT *
FROM iris.test
TO PREDICT iris.predict.class
USING sqlflow_models.my_dnn_model;
تتميز البنية العامة لـ SQLFlow بالخصائص التالية:
الناتج عبارة عن سير عمل Argo يتم تشغيله بشكل موزع على مجموعة Kubernetes، مما يضمن:
Microsoft SQL Server: يوفر خدمات التعلم الآلي، ولكنه يتطلب R أو Python كنصوص برمجية خارجية.
Teradata SQL for DL: يوفر خدمة RESTful، والتي يمكن استدعاؤها من بناء جملة SQL SELECT الموسع.
Google BigQuery: يمكّن التعلم الآلي في SQL من خلال عبارة CREATE MODEL
.
تكمن ميزة SQLFlow في:
يحتوي SQLFlow على نظام بيئي كامل مفتوح المصدر:
SQLFlow مناسب بشكل خاص للسيناريوهات التالية:
من خلال الجمع بين SQL والذكاء الاصطناعي بشكل مثالي، يوفر SQLFlow منصة تعلم آلي قوية وسهلة الاستخدام لمحترفي البيانات. لا يقلل فقط من حاجز استخدام التعلم الآلي، ولكنه يضمن أيضًا قابلية التوسع والموثوقية على مستوى المؤسسة من خلال بنية أصلية للسحابة. بالنسبة للمؤسسات التي تتطلع إلى دمج قدرات التعلم الآلي بسلاسة في مهام سير عمل البيانات الخاصة بها، يعد SQLFlow خيارًا مثاليًا.