KI
Entdecken Sie praxisnahe Einblicke, Forschungsergebnisse und Benchmarks im Bereich der künstlichen Intelligenz, darunter generative KI, große Sprachmodelle, RAG, Governance-Frameworks, MLOps-Praktiken und KI-Hardware. Verschaffen Sie sich ein Verständnis für wichtige Werkzeuge, Implementierungsstrategien und Anwendungsfälle in Unternehmen, die die KI-Landschaft prägen.
Wie man eine KI-Infrastruktur und ihre wichtigsten Komponenten entwirft
Die KI-Infrastruktur bildet die Grundlage aktueller KI-Anwendungen und kombiniert spezialisierte Hardware, Software und Betriebsmethoden, um den Anforderungen der KI gerecht zu werden. Unternehmen verschiedenster Branchen nutzen sie, um KI in Produkte und Prozesse zu integrieren, beispielsweise in Chatbots (z. B. ChatGPT), Gesichts- und Spracherkennung sowie Computer Vision.
Top-Vektordatenbank für RAG: Qdrant vs Weaviate vs Pinecone
Vektordatenbanken bilden die Grundlage für die Abfrageschicht in RAG-Workflows, indem sie Dokument- und Abfrageeinbettungen als hochdimensionale Vektoren speichern. Sie ermöglichen schnelle Ähnlichkeitssuchen basierend auf Vektordistanzen. Wir haben sechs Anbieter von Vektordatenbanken hinsichtlich ihrer Preisstrukturen und Leistung verglichen: Vergleich von Vektordatenbanken: Preise & Leistung.
Vergleich der besten Bilderkennungstools im Jahr
Wir evaluierten die Leistung führender Cloud-Bilderkennungstools für Objekterkennungsaufgaben im realen Einsatz, indem wir ihre Standard-API-Konfigurationen anhand von 100 Bildern in fünf Klassen verglichen. Dies umfasste den Vergleich der Leistung, die Analyse von Funktionen und den Preisvergleich der Serviceangebote. Benchmark-Ergebnisse: Leistungsübersicht bei IoU=0,5.
Die 125 besten Anwendungen für generative KI
Basierend auf unserer Analyse von über 30 Fallstudien und 10 Benchmarks, in denen wir über 40 Produkte getestet und verglichen haben, identifizierten wir 125 Anwendungsfälle für generative KI in den folgenden Kategorien: Weitere KI-Anwendungen für Anfragen mit einer einzigen richtigen Antwort (z. B. Vorhersage oder Klassifizierung) finden Sie unter KI-Anwendungen.
Marktanteile von LLM: Vergleich von Nutzung und Akzeptanz
Wir analysierten die Marktanteile von LLM (Large Language Models) anhand von Nutzungsdaten und geschätzten Webseitenbesuchen, um die Verteilung der Nachfrage nach großen Sprachmodellen auf KI-Labore und KI-Anwendungen darzustellen: Vergleich der LLM-Marktanteile nach Ländern. Die Methodik erläutert, wie wir diese Ergebnisse gemessen und berechnet haben. Die Vereinigten Staaten führten die Liste der Webseitenbesuche an.
Die 10 besten serverlosen GPU-Clouds und 14 kostengünstige GPUs
Serverlose GPUs bieten einfach skalierbare Rechenleistung für KI-Workloads. Bei großen Projekten können die Kosten jedoch erheblich sein. Navigieren Sie zu den für Ihre Bedürfnisse relevanten Abschnitten: Preis pro Durchsatz bei serverlosen GPUs. Anbieter serverloser GPUs bieten unterschiedliche Leistungsstufen und Preismodelle für KI-Workloads.
Vergleich relationaler Fundamentmodelle
Wir haben SAP-RPT-1-OSS anhand von Gradient Boosting (LightGBM, CatBoost) auf 17 tabellarischen Datensätzen verglichen, die das semantisch-numerische Spektrum abdecken: kleine/hochsemantische Tabellen, gemischte Geschäftsdatensätze und große, niedrigsemantische numerische Datensätze. Unser Ziel ist es, zu ermitteln, wo die vortrainierten semantischen Priors eines relationalen LLM Vorteile gegenüber traditionellen Baummodellen bieten und wo sie bei großen Datenmengen oder niedrigsemantischen Strukturen an ihre Grenzen stoßen.
Die 10 besten mehrsprachigen Einbettungsmodelle für RAG
Wir haben zehn mehrsprachige Einbettungsmodelle anhand von ca. 606.000 Amazon-Rezensionen in sechs Sprachen (Deutsch, Englisch, Spanisch, Französisch, Japanisch und Chinesisch) getestet. Dazu generierten wir 1.800 Suchanfragen (300 pro Sprache), die jeweils konkrete Details aus der zugehörigen Rezension enthielten.
LLM-Quantisierung: BF16 vs FP8 vs INT4
Wir haben Qwen3-32B mit vier Genauigkeitsstufen (BF16, FP8, GPTQ-Int8, GPTQ-Int4) auf einer einzelnen NVIDIA H100 80GB GPU getestet. Jede Konfiguration wurde anhand von zwei Benchmarks (~12.200 Fragen) zur Wissens- und Codegenerierung sowie über 2.000 Inferenzläufen zur Messung des Durchsatzes evaluiert.
GPU-Parallelitäts-Benchmark: H100 vs. H200 vs. B200 vs. MI300X
Ich habe die letzten 20 Jahre der Optimierung der Rechenleistung auf Systemebene gewidmet. Wir haben die neuesten GPUs der Serie NVIDIA, darunter die Modelle H100, H200 und B200 sowie die MI300X der Serie AMD, hinsichtlich ihrer Skalierungsfähigkeit bei gleichzeitigen Anfragen getestet. Mithilfe des vLLM-Frameworks und des gpt-oss-20b-Modells haben wir untersucht, wie diese GPUs mit 1 bis 512 gleichzeitigen Anfragen umgehen.