Dienstleistungen
Jetzt kontaktieren

KI

Entdecken Sie praxisnahe Einblicke, Forschungsergebnisse und Benchmarks im Bereich der künstlichen Intelligenz, darunter generative KI, große Sprachmodelle, RAG, Governance-Frameworks, MLOps-Praktiken und KI-Hardware. Verschaffen Sie sich ein Verständnis für wichtige Werkzeuge, Implementierungsstrategien und Anwendungsfälle in Unternehmen, die die KI-Landschaft prägen.

Erkunden Sie KI

Vergleich von visuellen Sprachmodellen mit der Bilderkennung

AI ModelsApr 24

Können fortschrittliche Bildverarbeitungsmodelle (VLMs) traditionelle Bilderkennungsmodelle ersetzen? Um dies herauszufinden, haben wir 16 führende Modelle in drei Paradigmen verglichen: traditionelle CNNs (ResNet, EfficientNet), VLMs (wie z. B. GPT-4.1, Gemini 2.5) und Cloud-APIs (AWS, Google, Azure).

Mehr lesen
AI HardwareApr 24

Wie man eine KI-Infrastruktur und ihre wichtigsten Komponenten entwirft

Die KI-Infrastruktur bildet die Grundlage aktueller KI-Anwendungen und kombiniert spezialisierte Hardware, Software und Betriebsmethoden, um den Anforderungen der KI gerecht zu werden. Unternehmen verschiedenster Branchen nutzen sie, um KI in Produkte und Prozesse zu integrieren, beispielsweise in Chatbots (z. B. ChatGPT), Gesichts- und Spracherkennung sowie Computer Vision.

Vector DBApr 24

Top-Vektordatenbank für RAG: Qdrant vs Weaviate vs Pinecone

Vektordatenbanken bilden die Grundlage für die Abfrageschicht in RAG-Workflows, indem sie Dokument- und Abfrageeinbettungen als hochdimensionale Vektoren speichern. Sie ermöglichen schnelle Ähnlichkeitssuchen basierend auf Vektordistanzen. Wir haben sechs Anbieter von Vektordatenbanken hinsichtlich ihrer Preisstrukturen und Leistung verglichen: Vergleich von Vektordatenbanken: Preise & Leistung.

AI FoundationsApr 24

Vergleich der besten Bilderkennungstools im Jahr

Wir evaluierten die Leistung führender Cloud-Bilderkennungstools für Objekterkennungsaufgaben im realen Einsatz, indem wir ihre Standard-API-Konfigurationen anhand von 100 Bildern in fünf Klassen verglichen. Dies umfasste den Vergleich der Leistung, die Analyse von Funktionen und den Preisvergleich der Serviceangebote. Benchmark-Ergebnisse: Leistungsübersicht bei IoU=0,5.

GenAI ApplicationsApr 22

Die 125 besten Anwendungen für generative KI

Basierend auf unserer Analyse von über 30 Fallstudien und 10 Benchmarks, in denen wir über 40 Produkte getestet und verglichen haben, identifizierten wir 125 Anwendungsfälle für generative KI in den folgenden Kategorien: Weitere KI-Anwendungen für Anfragen mit einer einzigen richtigen Antwort (z. B. Vorhersage oder Klassifizierung) finden Sie unter KI-Anwendungen.

LLMApr 21

Marktanteile von LLM: Vergleich von Nutzung und Akzeptanz

Wir analysierten die Marktanteile von LLM (Large Language Models) anhand von Nutzungsdaten und geschätzten Webseitenbesuchen, um die Verteilung der Nachfrage nach großen Sprachmodellen auf KI-Labore und KI-Anwendungen darzustellen: Vergleich der LLM-Marktanteile nach Ländern. Die Methodik erläutert, wie wir diese Ergebnisse gemessen und berechnet haben. Die Vereinigten Staaten führten die Liste der Webseitenbesuche an.

AI HardwareApr 16

Die 10 besten serverlosen GPU-Clouds und 14 kostengünstige GPUs

Serverlose GPUs bieten einfach skalierbare Rechenleistung für KI-Workloads. Bei großen Projekten können die Kosten jedoch erheblich sein. Navigieren Sie zu den für Ihre Bedürfnisse relevanten Abschnitten: Preis pro Durchsatz bei serverlosen GPUs. Anbieter serverloser GPUs bieten unterschiedliche Leistungsstufen und Preismodelle für KI-Workloads.

AI ModelsApr 15

Vergleich relationaler Fundamentmodelle

Wir haben SAP-RPT-1-OSS anhand von Gradient Boosting (LightGBM, CatBoost) auf 17 tabellarischen Datensätzen verglichen, die das semantisch-numerische Spektrum abdecken: kleine/hochsemantische Tabellen, gemischte Geschäftsdatensätze und große, niedrigsemantische numerische Datensätze. Unser Ziel ist es, zu ermitteln, wo die vortrainierten semantischen Priors eines relationalen LLM Vorteile gegenüber traditionellen Baummodellen bieten und wo sie bei großen Datenmengen oder niedrigsemantischen Strukturen an ihre Grenzen stoßen.

RAGApr 15

Die 10 besten mehrsprachigen Einbettungsmodelle für RAG

Wir haben zehn mehrsprachige Einbettungsmodelle anhand von ca. 606.000 Amazon-Rezensionen in sechs Sprachen (Deutsch, Englisch, Spanisch, Französisch, Japanisch und Chinesisch) getestet. Dazu generierten wir 1.800 Suchanfragen (300 pro Sprache), die jeweils konkrete Details aus der zugehörigen Rezension enthielten.

LLMApr 15

LLM-Quantisierung: BF16 vs FP8 vs INT4

Wir haben Qwen3-32B mit vier Genauigkeitsstufen (BF16, FP8, GPTQ-Int8, GPTQ-Int4) auf einer einzelnen NVIDIA H100 80GB GPU getestet. Jede Konfiguration wurde anhand von zwei Benchmarks (~12.200 Fragen) zur Wissens- und Codegenerierung sowie über 2.000 Inferenzläufen zur Messung des Durchsatzes evaluiert.

AI HardwareApr 15

GPU-Parallelitäts-Benchmark: H100 vs. H200 vs. B200 vs. MI300X

Ich habe die letzten 20 Jahre der Optimierung der Rechenleistung auf Systemebene gewidmet. Wir haben die neuesten GPUs der Serie NVIDIA, darunter die Modelle H100, H200 und B200 sowie die MI300X der Serie AMD, hinsichtlich ihrer Skalierungsfähigkeit bei gleichzeitigen Anfragen getestet. Mithilfe des vLLM-Frameworks und des gpt-oss-20b-Modells haben wir untersucht, wie diese GPUs mit 1 bis 512 gleichzeitigen Anfragen umgehen.