Dienstleistungen
Jetzt kontaktieren

KI

Entdecken Sie praxisnahe Einblicke, Forschungsergebnisse und Benchmarks im Bereich der künstlichen Intelligenz, darunter generative KI, große Sprachmodelle, RAG, Governance-Frameworks, MLOps-Praktiken und KI-Hardware. Verschaffen Sie sich ein Verständnis für wichtige Werkzeuge, Implementierungsstrategien und Anwendungsfälle in Unternehmen, die die KI-Landschaft prägen.

Erkunden Sie KI

Die 7 besten Open-Source-KI-Codierungsagenten

AI CodingFeb 27

In früheren Evaluierungen haben wir sowohl Open-Source- als auch proprietäre Agentic-CLIs hinsichtlich ihrer Leistung bei Webentwicklungsaufgaben verglichen. Einige Open-Source-Agenten schnitten dabei genauso gut ab wie die kostenpflichtigen Alternativen. Daher haben wir auch die besten Open-Source-Codierungsagenten für Nutzer mit Datenschutzbedenken aufgelistet. Ergebnisse des Benchmarks für Open-Source-KI-Codierungsagenten.

Mehr lesen
GenAI ApplicationsFeb 25

Generative KI für E-Mail-Marketing: Anwendungen & Beispiele

Generative KI hat sich über die einfache Erstellung von E-Mail-Inhalten hinaus weiterentwickelt und ermöglicht nun Echtzeit-Personalisierung, multimodale Interaktionen und kanalübergreifende Orchestrierung, die auf das Kundenverhalten reagiert. Der Wandel von segmentbasierten Kampagnen hin zu individueller Personalisierung stellt die bedeutendste Veränderung im E-Mail-Marketing seit der Automatisierung dar.

RAGFeb 4

Die besten RAG-Tools, Frameworks und Bibliotheken

RAG (Retrieval-Augmented Generation) verbessert die Ergebnisse von LLM-Systemen durch die Einbindung externer Datenquellen. Wir haben verschiedene Einbettungsmodelle verglichen und separat unterschiedliche Chunk-Größen getestet, um die optimalen Kombinationen für RAG-Systeme zu ermitteln. Entdecken Sie führende RAG-Frameworks und -Tools, erfahren Sie, was RAG ist, wie es funktioniert, welche Vorteile es bietet und welche Rolle es in der heutigen LLM-Landschaft spielt.

AI CodingJan 28

8 KI-Code-Modelle im Vergleich: LMC-Eval

Mehr als 37 % der Aufgaben, die KI-Modelle bearbeiten, betreffen Computerprogrammierung und Mathematik. Um das passende KI-Modell für Programmieraufgaben zu finden, führen wir einen neuen Benchmark ein: LMC-Eval. Darin testen wir führende KI-Modelle hinsichtlich ihrer Leistung bei logischen Programmieraufgaben.

Document AutomationJan 28

OCR-Benchmark: Genauigkeit der Textextraktion / -erfassung

Die Genauigkeit der Texterkennung (OCR) ist für viele Dokumentenverarbeitungsaufgaben entscheidend, und moderne multimodale Spracherkennungssysteme (LLMs) bieten eine Alternative zur herkömmlichen OCR. Wir haben führende OCR-Dienste in DeltOCR Bench verglichen, um ihre Genauigkeit bei verschiedenen Dokumenttypen zu ermitteln: OCR-Benchmark: DeltOCR Bench.

AI VideoJan 28

Text-zu-Video-Generator-Benchmark

Ein Text-zu-Video-Generator ist ein KI-System, das schriftliche Anweisungen in kurze Videos umwandelt, indem es Bilder, Bewegungen und teilweise auch Ton direkt aus der natürlichen Sprache generiert. Wir verglichen die fünf besten Text-zu-Video-Generatoren anhand von zehn Aufgaben, die entwickelt wurden, um die Einhaltung der Anweisungen, die zeitliche Konsistenz, den physikalischen Realismus und bekannte Fehlerquellen wie Objektpermanenz und Feinmotorik zu testen.

Document AutomationJan 23

Benchmark für Beleg-OCR mit LLMs

Die Datenextraktion aus Belegen ist für Unternehmen unerlässlich, da Millionen von Angestellten ihre berufsbedingten Ausgaben per Beleg einreichen. Dank der jüngsten Entwicklungen im Bereich der generativen KI und großer Sprachmodelle hat die Genauigkeit der Datenextraktion ein Niveau erreicht, das mit dem des Menschen vergleichbar ist. Wir haben die Genauigkeit der Datenextraktion von Sprachmodellen anhand von Belegbildern niedriger und hoher Qualität mithilfe von […] evaluiert.

LLMJan 22

LLM-Parameter: GPT-5 Hoch, Mittel, Niedrig und Minimal

Neue LLMs, wie beispielsweise die OpenAI-Familie GPT-5, sind in verschiedenen Versionen (z. B. GPT-5, GPT-5-mini und GPT-5-nano) und mit unterschiedlichen Parametereinstellungen (hoch, mittel, niedrig und minimal) erhältlich. Im Folgenden untersuchen wir die Unterschiede zwischen diesen Modellversionen anhand ihrer Benchmark-Ergebnisse und der Kosten für die Durchführung der Benchmarks. Preis-Leistungs-Verhältnis: Wichtigste Erkenntnisse.

AI HardwareJan 22

GPU-Software für KI: CUDA vs. ROCm im Jahr

Reine Hardware-Spezifikationen erzählen nur die halbe Geschichte beim GPU-Computing. Um die KI-Leistung in der Praxis zu messen, führten wir 52 verschiedene Tests durch, in denen wir die MI300X von AMD mit den Modellen H100, H200 und B200 von NVIDIA in Multi-GPU- und Hochkonkurrenz-Szenarien verglichen. Während die MI300X von AMD mit 1.307 TFLOPS gegenüber 990 TFLOPS bei den Modellen H100/H200 von NVIDIA aufwartet – ein theoretischer Vorteil von 32 % –, sieht die Leistung in der Praxis anders aus.

Document AutomationJan 22

Vergleichsmessung der Rechnungs-OCR: Extraktionsgenauigkeit von LLMs im Vergleich zu OCRs

Die Rechnungsverarbeitung ist ein wichtiger, aber arbeitsintensiver Geschäftsprozess, der traditionell die manuelle Datenerfassung und -eingabe in Buchhaltungssysteme erfordert. Dieser manuelle Ansatz ist zeitaufwändig und fehleranfällig.

Voice AIJan 22

Spracherkennungs-Vergleichstest: Deepgram vs. Whisper

Wir haben die führenden Anbieter von Spracherkennungssystemen (STT) verglichen, insbesondere im Hinblick auf Anwendungen im Gesundheitswesen. Unser Vergleich nutzte reale Beispiele, um die Transkriptionsgenauigkeit in medizinischen Kontexten zu bewerten, wo Präzision entscheidend ist. Ergebnisse des Spracherkennungs-Benchmarks: Basierend auf der Wortfehlerrate (WER) und der Zeichenfehlerrate (CER) weist GPT-4o-transcribe die höchste Transkriptionsgenauigkeit aller evaluierten Spracherkennungssysteme auf.