Wir verglichen die führenden Anbieter von Kartendatensätzen (Google, Bright Data und Actowiz) anhand eines Benchmarks auf Feldebene. Anstatt die Anbieter zu ranken, dokumentierten wir Unterschiede in Schemabreite, Feldvollständigkeit, Umgang mit Nullwerten und Datenintegrationsfähigkeit.
Beide Systeme umfassen Kontextinformationen auf Ortsebene, Inhaltsinformationen auf Bewertungsebene und Metadaten auf Bewertungsebene. Bright Data zeichnet sich durch eine bessere Darstellung fehlender Werte, strukturierte Bewertungsmetadaten und eine höhere Integrationsfähigkeit aus. Actowiz hingegen bietet eine größere Bandbreite an sichtbaren Schemata und eine stärkere Fokussierung auf die Bewertungsfelder.
Um zu erfahren, wie Google Maps-Daten mithilfe eines Scrapers erfasst werden können, sehen Sie sich unseren Google Maps Scraper Benchmark an.
Gemeinsame Feldabdeckung
Kategorie | Bright Data | Actowiz |
|---|---|---|
Platzfelder | ✅ | ✅ |
Überprüfungsfelder | ✅ | ✅ |
Prüferfelder | ✅ | ✅ |
Medienfelder | ✅ | ✅ |
Antwortfelder | ✅ | ✅ |
- Ortsfelder: URL, ID, Name, Land, Adresse, Kategorie, Gesamtbewertung, Anzahl der Bewertungen, Standortkennungen
- Kernfelder für Bewertungen: Bewertungs-ID, Text, Bewertung, Datum, Likes, Bewertungsdetails
- Felder für Rezensenten: Name des Rezensenten, URL, Anzahl der Rezensionen, Anzahl der Fotos, Local-Guide-Kennzeichnung, URL des Profilbilds
- Medienfelder prüfen: Fotos prüfen
- Antwortfelder prüfen: Antwort des Eigentümers und Datum der Eigentümerantwort
Beobachtete Unterschiede in der Probenverwendbarkeit
Anmerkungen zu den beobachteten Unterschieden:
- Fehlende Werte: In der Actowiz-Stichprobe werden fehlende Einträge als „N/A“ angezeigt, während in der Stichprobe Bright Data der Wert „null“ verwendet wird. Platzhalterwerte wie „N/A“ müssen in der Regel vor dem Einfügen von Daten in Datenbanken geändert werden, während „null“-Werte mit den meisten Analysetools direkt kompatibel sind.
- Verfügbarkeit von Bewertungstexten: In den sichtbaren Actowiz-Zeilen ist das Feld „Bewertungstext“ häufig leer oder mit „N/A“ gekennzeichnet, was eine schnelle qualitative Überprüfung des Nutzerfeedbacks erschwert. Im Beispiel Bright Data enthalten die sichtbaren Zeilen mehr tatsächlichen Bewertungstext, wodurch das Beispiel sofort leichter zu überprüfen ist.
- Metadaten zur Fotoanzahl: Actowiz stellt Felder wie review_photos_count explizit zur Verfügung, was nützlich ist, um die Medienpräsenz pro Rezension direkt zu messen. In der Stichprobe Bright Data sind fotobezogene Informationen zwar vorhanden, aber nicht so deutlich in separate Zählfelder unterteilt.
Dieser Vergleich basiert auf einer Stichprobenanalyse; Einzelheiten dazu finden Sie im Abschnitt „Methodik“ .
Beste Kartendatensatzdienste (Google)
Der Datensatz „Maps review dataset“ (Bright Data, Google) umfasst eine Vielzahl von Feldern zu Ort, Bewertung und Rezensent und ist in seinem Umfang vergleichbar mit Actowiz. Die Stichprobe von Bright Data wirkt jedoch übersichtlicher und konsistenter in der Darstellung der Werte.
Fehlende Werte werden als Nullwerte gekennzeichnet, was die Verwaltung in Datenbanken, Dataframes und Workflows vereinfacht. Das Beispiel enthält außerdem mehr Bewertungstext. Darüber hinaus enthält das Feld „review_details“ strukturierte Titel-Wert-Paare in einem JSON-ähnlichen Format, z. B. Speisen, Service oder Menüart.
Diese Struktur ermöglicht die Analyse von Bewertungsdaten auf Aspektebene, die über den reinen Text hinausgeht. Das Beispiel Bright Data enthält außerdem Felder auf Rezensentenebene, wie z. B. die Anzahl der Bewertungen, die Anzahl der Fotos, die Profil-URL, die Kennzeichnung als lokaler Reiseführer und die URL des Profilbilds.
Insgesamt bietet Bright Data eine bessere Stichprobenreinheit und Benutzerfreundlichkeit für strukturierte Daten als die Bereitstellung von mehr sichtbaren Spalten.
Der Actowiz-Kartenbewertungsdatensatz (Google) zeichnet sich durch ein umfassendes Schema aus, das neben Standardfeldern für Orte und Bewertungen auch zusätzliche Felder für den Bewertenden und die Medien umfasst. Dazu gehören die Profil-URL des Bewertenden, die Anzahl der Bewertungen und Fotos, die Kennzeichnung als lokaler Reiseführer, die URL des Profilbildes, die URLs der Bewertungsfotos und die Anzahl der Bewertungsfotos.
Diese zusätzlichen Informationen zu den Rezensenten sind für spätere Analysen wertvoll. Datensätze mit Rezensionstexten und Bewertungen unterstützen zwar die Stimmungsanalyse, ermöglichen aber keine Untersuchungen der Rezensentenaktivität oder der Mediennutzung.
Ein zentrales Problem der Actowiz-Daten besteht darin, dass viele Spalten leer sind und fehlende Werte als „N/A“ angezeigt werden. Dieses Format ist zwar in CSV-Dateien lesbar, Analyse-Pipelines erfordern jedoch, dass diese Platzhalter vor der Weiterverarbeitung in Nullwerte umgewandelt werden.
Zusammenfassend lässt sich sagen, dass Actowiz ein umfassenderes Datenschema bietet, die Daten jedoch vor der Verwendung einer zusätzlichen Bereinigung bedürfen.
Google Methodik der Kartenprüfungsdatensätze
Wir verwendeten Anbieterstichproben, die Google-Kartendaten auf Bewertungsebene repräsentieren. Jede Zeile in beiden Stichproben entspricht einer einzelnen Bewertung, wobei Details auf Ortsebene wie Firmenname, Adresse, Kategorie und Gesamtbewertung für jeden Eintrag wiederholt werden.
Dieser Benchmark basiert auf Stichproben und bewertet weder die vollständige Produktionsabdeckung noch die Zuverlässigkeit der Datenextraktion im großen Maßstab, die Duplikatraten oder die Feldkonsistenz der Daten aller Anbieter. Die Stichproben wurden anhand der folgenden Kriterien bewertet:
- Westfield World Trade Center, New York City
- Brookfield Place, New York City
- Die Geschäfte am Columbus Circle, New York City
Ortsbezogene Felder
- Orts-URL
- Orts-ID
- Ortsname
- Land
- vollständige Adresse
- Kategorie
- Gesamtbewertung
- Gesamtbewertungen
- CID oder gleichwertige Unternehmenskennung
- Karten-/Standortkennung
Überprüfungsfelder
- Bewertungs-ID
- Rezensionstext
- Bewertung
- Überprüfungsdatum
- Anzahl der Likes
- Antwort des Eigentümers
- Antwortdatum des Eigentümers
- review_photos oder review_photos_count
- Rezensionsdetails
- Fragen und Antworten, falls verfügbar
Felder auf Prüferebene
- Name des Rezensenten
- URL des Rezensentenprofils
- Gesamtanzahl der Rezensionen
- Gesamtanzahl der Fotos des Rezensenten
- lokales_Guide-Flag
- URL des Profilbilds des Rezensenten
Seien Sie der Erste, der kommentiert
Ihre E-Mail-Adresse wird nicht veröffentlicht. Alle Felder sind erforderlich.