KI
Entdecken Sie praxisnahe Einblicke, Forschungsergebnisse und Benchmarks im Bereich der künstlichen Intelligenz, darunter generative KI, große Sprachmodelle, RAG, Governance-Frameworks, MLOps-Praktiken und KI-Hardware. Verschaffen Sie sich ein Verständnis für wichtige Werkzeuge, Implementierungsstrategien und Anwendungsfälle in Unternehmen, die die KI-Landschaft prägen.
Generative KI für E-Mail-Marketing: Anwendungen & Beispiele
Generative KI hat sich über die einfache Erstellung von E-Mail-Inhalten hinaus weiterentwickelt und ermöglicht nun Echtzeit-Personalisierung, multimodale Interaktionen und kanalübergreifende Orchestrierung, die auf das Kundenverhalten reagiert. Der Wandel von segmentbasierten Kampagnen hin zu individueller Personalisierung stellt die bedeutendste Veränderung im E-Mail-Marketing seit der Automatisierung dar.
Die besten RAG-Tools, Frameworks und Bibliotheken
RAG (Retrieval-Augmented Generation) verbessert die Ergebnisse von LLM-Systemen durch die Einbindung externer Datenquellen. Wir haben verschiedene Einbettungsmodelle verglichen und separat unterschiedliche Chunk-Größen getestet, um die optimalen Kombinationen für RAG-Systeme zu ermitteln. Entdecken Sie führende RAG-Frameworks und -Tools, erfahren Sie, was RAG ist, wie es funktioniert, welche Vorteile es bietet und welche Rolle es in der heutigen LLM-Landschaft spielt.
8 KI-Code-Modelle im Vergleich: LMC-Eval
Mehr als 37 % der Aufgaben, die KI-Modelle bearbeiten, betreffen Computerprogrammierung und Mathematik. Um das passende KI-Modell für Programmieraufgaben zu finden, führen wir einen neuen Benchmark ein: LMC-Eval. Darin testen wir führende KI-Modelle hinsichtlich ihrer Leistung bei logischen Programmieraufgaben.
OCR-Benchmark: Genauigkeit der Textextraktion / -erfassung
Die Genauigkeit der Texterkennung (OCR) ist für viele Dokumentenverarbeitungsaufgaben entscheidend, und moderne multimodale Spracherkennungssysteme (LLMs) bieten eine Alternative zur herkömmlichen OCR. Wir haben führende OCR-Dienste in DeltOCR Bench verglichen, um ihre Genauigkeit bei verschiedenen Dokumenttypen zu ermitteln: OCR-Benchmark: DeltOCR Bench.
Text-zu-Video-Generator-Benchmark
Ein Text-zu-Video-Generator ist ein KI-System, das schriftliche Anweisungen in kurze Videos umwandelt, indem es Bilder, Bewegungen und teilweise auch Ton direkt aus der natürlichen Sprache generiert. Wir verglichen die fünf besten Text-zu-Video-Generatoren anhand von zehn Aufgaben, die entwickelt wurden, um die Einhaltung der Anweisungen, die zeitliche Konsistenz, den physikalischen Realismus und bekannte Fehlerquellen wie Objektpermanenz und Feinmotorik zu testen.
Benchmark für Beleg-OCR mit LLMs
Die Datenextraktion aus Belegen ist für Unternehmen unerlässlich, da Millionen von Angestellten ihre berufsbedingten Ausgaben per Beleg einreichen. Dank der jüngsten Entwicklungen im Bereich der generativen KI und großer Sprachmodelle hat die Genauigkeit der Datenextraktion ein Niveau erreicht, das mit dem des Menschen vergleichbar ist. Wir haben die Genauigkeit der Datenextraktion von Sprachmodellen anhand von Belegbildern niedriger und hoher Qualität mithilfe von […] evaluiert.
LLM-Parameter: GPT-5 Hoch, Mittel, Niedrig und Minimal
Neue LLMs, wie beispielsweise die OpenAI-Familie GPT-5, sind in verschiedenen Versionen (z. B. GPT-5, GPT-5-mini und GPT-5-nano) und mit unterschiedlichen Parametereinstellungen (hoch, mittel, niedrig und minimal) erhältlich. Im Folgenden untersuchen wir die Unterschiede zwischen diesen Modellversionen anhand ihrer Benchmark-Ergebnisse und der Kosten für die Durchführung der Benchmarks. Preis-Leistungs-Verhältnis: Wichtigste Erkenntnisse.
GPU-Software für KI: CUDA vs. ROCm im Jahr
Reine Hardware-Spezifikationen erzählen nur die halbe Geschichte beim GPU-Computing. Um die KI-Leistung in der Praxis zu messen, führten wir 52 verschiedene Tests durch, in denen wir die MI300X von AMD mit den Modellen H100, H200 und B200 von NVIDIA in Multi-GPU- und Hochkonkurrenz-Szenarien verglichen. Während die MI300X von AMD mit 1.307 TFLOPS gegenüber 990 TFLOPS bei den Modellen H100/H200 von NVIDIA aufwartet – ein theoretischer Vorteil von 32 % –, sieht die Leistung in der Praxis anders aus.
Vergleichsmessung der Rechnungs-OCR: Extraktionsgenauigkeit von LLMs im Vergleich zu OCRs
Die Rechnungsverarbeitung ist ein wichtiger, aber arbeitsintensiver Geschäftsprozess, der traditionell die manuelle Datenerfassung und -eingabe in Buchhaltungssysteme erfordert. Dieser manuelle Ansatz ist zeitaufwändig und fehleranfällig.
Spracherkennungs-Vergleichstest: Deepgram vs. Whisper
Wir haben die führenden Anbieter von Spracherkennungssystemen (STT) verglichen, insbesondere im Hinblick auf Anwendungen im Gesundheitswesen. Unser Vergleich nutzte reale Beispiele, um die Transkriptionsgenauigkeit in medizinischen Kontexten zu bewerten, wo Präzision entscheidend ist. Ergebnisse des Spracherkennungs-Benchmarks: Basierend auf der Wortfehlerrate (WER) und der Zeichenfehlerrate (CER) weist GPT-4o-transcribe die höchste Transkriptionsgenauigkeit aller evaluierten Spracherkennungssysteme auf.