Jina AI Reader ist ein Open-Source-Tool, das darauf abzielt, beliebige URLs in ein LLM-freundliches (Large Language Model) Eingabeformat zu konvertieren. Das Projekt wird von Jina AI entwickelt und gewartet und unter der Apache-2.0-Open-Source-Lizenz vertrieben. Es bietet hochwertige Web-Content-Extraktionsdienste für AI Agents und RAG-Systeme (Retrieval-Augmented Generation).
https://r.jina.ai/
hinzuOriginal-URL: https://en.wikipedia.org/wiki/Artificial_intelligence
Konvertierte URL: https://r.jina.ai/https://en.wikipedia.org/wiki/Artificial_intelligence
https://s.jina.ai/
hinzuAnfrage: Who will win 2024 US presidential election?
Such-URL: https://s.jina.ai/Who%20will%20win%202024%20US%20presidential%20election%3F
Image [idx]: [caption]
x-with-generated-alt: true
site=example.com
in der Anfragecurl 'https://s.jina.ai/When%20was%20Jina%20AI%20founded%3F?site=jina.ai&site=github.com'
# Bildbeschreibungen aktivieren
x-with-generated-alt: true
# Cookie-Einstellungen weiterleiten
x-set-cookie: [cookie_string]
# Cache umgehen
x-no-cache: true
# Benutzerdefinierte Cache-Toleranz (Sekunden)
x-cache-tolerance: [seconds]
# Proxy-Server angeben
x-proxy-url: [proxy_url]
# Ziel-Element-Selektor
x-target-selector: [css_selector]
# Warten auf das Erscheinen eines bestimmten Elements
x-wait-for-selector: [css_selector]
# Timeout festlegen
x-timeout: [seconds]
# Markdown-Format zurückgeben (Lesbarkeitsfilter umgehen)
x-respond-with: markdown
# Original-HTML zurückgeben
x-respond-with: html
# Nur Text zurückgeben
x-respond-with: text
# URL des Webseiten-Screenshots zurückgeben
x-respond-with: screenshot
# Streaming-Modus aktivieren
curl -H "Accept: text/event-stream" https://r.jina.ai/[URL]
# JSON-Formatierte Antwort erhalten
curl -H "Accept: application/json" https://r.jina.ai/[URL]
JSON-Antwortstruktur:
{
"url": "Original-URL",
"title": "Seitentitel",
"content": "Extrahierter Inhalt"
}
Aufgrund der Besonderheiten von SPAs werden folgende Lösungen angeboten:
Für URLs, die #
enthalten, verwenden Sie die POST-Methode:
curl -X POST 'https://r.jina.ai/' -d 'url=https://example.com/#/route'
Für Webseiten, die vorab geladene Inhalte anzeigen:
curl 'https://example.com/' -H 'x-timeout: 30'
curl 'https://example.com/' -H 'x-wait-for-selector: #content'
curl -H "Accept: text/event-stream" https://r.jina.ai/https://example.com/
Jina AI Reader ist ein leistungsstarkes Open-Source-Tool, das speziell für moderne KI-Systeme entwickelt wurde und die Format- und Qualitätsprobleme löst, mit denen LLMs bei der Verarbeitung von Web-Content konfrontiert sind. Durch einfaches Hinzufügen eines URL-Präfixes erhalten Sie hochwertigen, strukturierten Web-Content, der ein ideales Werkzeug für den Aufbau von AI Agents und RAG-Systemen ist.