Orivel Orivel
Menue oeffnen

Planung

Vergleicht Umsetzbarkeit, Priorisierung und Struktur in von KI erstellten Plänen.

In diesem Genre werden vor allem Faehigkeiten wie Machbarkeit, Vollstandigkeit, Priorisierung betrachtet.

Anders als system design oder analysis geht es hier staerker um Reihenfolge und Prioritaeten als um Architektur-Tiefe oder lange Argumentationsketten.

Ein hoher Wert hier garantiert weder starken Code noch ueberzeugende Texte oder grosse kreative Breite.

Wofuer starke Modelle in diesem Genre gut geeignet sind

Projektplaene, Roadmaps, Reiseplaene, Checklisten und die Ordnung naechster Schritte.

Was dieses Genre allein nicht zeigen kann

ob das Modell bei Implementierung, tiefer Architektur oder origineller Ideation herausragt.

Datenanalyse

Planung: Die GPT-5-Familie räumt ab, die Gemini-Reihe fällt weit zurück

30 bewertete Antworten Planung Aktualisiert 2026/6/7
1
GPT-5.5

OpenAI

90
Durchschnitt
100%
Siegesquote
1× 1. Platz 1 Stichproben
2
GPT-5 mini

OpenAI

90
Durchschnitt
100%
Siegesquote
4× 1. Platz 4 Stichproben
3
GPT-5.4

OpenAI

84
Durchschnitt
100%
Siegesquote
5× 1. Platz 5 Stichproben

Durchschnittswert je Modell

1 GPT-5.5
9.03
2 GPT-5 mini
9.02
3 GPT-5.4
8.45
4 Claude Sonnet 4.6
8.18
5 Claude Haiku 4.5
7.63
6 Gemini 2.5 Pro
6.82
7 Gemini 2.5 Flash
6.69
8 Gemini 2.5 Flash-Lite
5.64

Gewichtung

Machbarkeit 30% Vollstandigkeit 20% Priorisierung 20% Spezifitat 20% Klarheit 10%

Über 30 bewertete Antworten belegt die GPT-5-Familie geschlossen die Top 3, alle mit 100 % Siegquote. GPT-5.5 (9,03) und GPT-5 mini (9,02) stehen auf den Plätzen 1 und 2, und GPT-5.4 steht auf Platz 3 als der am besten belegte unter ihnen: 8,45 über 5 Stichproben, mit 5 ersten Plätzen. Kein GPT-5-Modell verlor in diesem Genre ein einziges Duell – der deutlichste Durchmarsch der Seite.

Anthropic liegt unter der GPT-5-Wand. Claude Sonnet 4.6 (8,18, 60 % über 5) ist ein solider Vierter, doch Claude Haiku 4.5 (7,63) gewinnt keines seiner 3 Duelle. Der Abfall von der GPT-5-Gruppe zu Anthropic beträgt rund 0,6 bis 0,9 Punkte, größer als in den meisten Genres.

Die Gemini-Reihe ist die klare Schwachstelle und verzeichnet den niedrigsten Wert der ganzen Seite: Gemini 2.5 Flash-Lite mit 5,64, mit Flash (6,69) und Pro (6,82) nicht weit darüber, alle mit 0 % Siegquote. Da Machbarkeit mit 30 am höchsten gewichtet ist und Priorisierung sowie Spezifität je 20, deutet der Abstand auf vagere oder weniger umsetzbare Pläne hin, nicht bloß auf kürzere.

Die Stichproben reichen von 1 bis 5 je Modell, daher ist die Spitzenreihenfolge vorläufig, doch die Spanne von 3,39 Punkten zwischen Erstem und Letztem ist mit Abstand die größte hier und dürfte kein Rauschen sein. Dennoch sind es bedingungsabhängige Messwerte für Planungs-Prompts, kein universelles Urteil.

Fazit

Für Planung ist die GPT-5-Familie die klare Wahl und GPT-5.4 die am besten begründbare (5 Stichproben, 5 erste Plätze, 100 % Siegquote). Die Gemini-Reihe fällt in diesem Genre stark zurück, einschließlich des niedrigsten überhaupt gemessenen Einzelwerts der Seite.

Diese Analyse basiert auf den von Orivel gemessenen Benchmark-Werten fuer dieses Genre und wird regelmaessig aktualisiert. Die Werte sind bedingungsabhaengige Messungen, keine absolute Wahrheit.

Ranking starker Modelle in diesem Genre

Dieses Ranking ist nach dem Durchschnittsscore nur innerhalb dieses Genres sortiert.

Zuletzt aktualisiert: 20 May 2026 09:42

#1
GPT-5.5 OpenAI

Siegesquote

100%

Durchschnittsscore

90
#2
GPT-5 mini OpenAI

Siegesquote

100%

Durchschnittsscore

90
#3
GPT-5.4 OpenAI

Siegesquote

100%

Durchschnittsscore

84
#4
Claude Sonnet 4.6 Anthropic

Siegesquote

60%

Durchschnittsscore

82
#5
Claude Haiku 4.5 Anthropic

Siegesquote

0%

Durchschnittsscore

76
#6
Gemini 2.5 Pro Google

Siegesquote

0%

Durchschnittsscore

68
#7
Gemini 2.5 Flash Google

Siegesquote

0%

Durchschnittsscore

67
#8
Gemini 2.5 Flash-Lite Google

Siegesquote

0%

Durchschnittsscore

56

Was in Planung bewertet wird

Kriterien und Gewichte fuer dieses Genre-Ranking.

Machbarkeit

30.0%

Dieses Kriterium ist enthalten, um Machbarkeit in der Antwort zu pruefen. Es hat mehr Gewicht, weil dieser Teil das Gesamtergebnis in diesem Genre stark praegt.

Vollstandigkeit

20.0%

Dieses Kriterium ist enthalten, um Vollstandigkeit in der Antwort zu pruefen. Es hat ein klares Gewicht, weil es die Qualitaet sichtbar beeinflusst, auch wenn es nicht alles bestimmt.

Priorisierung

20.0%

Dieses Kriterium ist enthalten, um Priorisierung in der Antwort zu pruefen. Es hat ein klares Gewicht, weil es die Qualitaet sichtbar beeinflusst, auch wenn es nicht alles bestimmt.

Spezifitat

20.0%

Dieses Kriterium ist enthalten, um Spezifitat in der Antwort zu pruefen. Es hat ein klares Gewicht, weil es die Qualitaet sichtbar beeinflusst, auch wenn es nicht alles bestimmt.

Klarheit

10.0%

Dieses Kriterium ist enthalten, um Klarheit in der Antwort zu pruefen. Es ist leichter gewichtet, weil es das Hauptziel unterstuetzt, das Genre aber nicht allein definiert.

Aktuelle Aufgaben

Planung

Anthropic Claude Opus 4.7 VS Google Gemini 2.5 Flash

Plane eine realisierbare Gemeindereparaturmesse

Erstelle einen operativen Plan für eine eintägige Community Repair Fair. Die Antwort sollte einen praktischen Zeitplan mit Aufgabenabfolge, Personalbesetzung, Prioritäten und Umgang mit Risiken enthalten. Beziehe die Vorbereitung vom Freitagnachmittag bis zur Aufräumung am Samstag mit ein. Wenn du eine kleine Annahme treffen musst, gib diese kurz an und halte sie vernünftig.

173
20 May 2026 09:42

Planung

OpenAI GPT-5.5 VS Google Gemini 2.5 Pro

72-Stunden-Plan zur Wiederherstellung des Produkt-Launches

Du bist die interimistische Projektleitung für ein mittelständisches SaaS-Unternehmen. Dein Team sollte in 72 Stunden ein großes neues Feature („Smart Reports“) für alle zahlenden Kunden ausrollen (Freitag 17:00 in deiner Zeitzone). Es ist jetzt Dienstag 17:00. Heute Morgen traten gleichzeitig folgende Probleme auf: 1. QA entdeckte einen kritischen Fehler: Bei bestimmten Zeiteinstellungen zeigen exportierte PDF-Berichte falsche Summen (um bis zu 8 % abweichend). Die Reproduktion ist zuverlässig; die Root-Cause wird vermutet, aber nicht bestätigt. 2. Der leitende Backend-Ingenieur (die einzige Person, die den Reporting-Service tief kennt) ist krank und voraussichtlich frühestens bis Donnerstagmorgen nicht erreichbar. 3. Marketing hat bereits eine Teaser-E-Mail an 40.000 Kunden verschickt, in der Verfügbarkeit am Freitag versprochen wird, und ein Presse-Embargo endet am Freitag um 09:00. 4. Der Kundensupport hat gemeldet, dass 3 Enterprise-Kunden (kombiniertes ARR ~600k USD) dieses Feature explizit in ihren Verlängerungs-Gesprächen angefordert haben und es für Freitag erwarten. 5. Dein CEO möchte, dass der Launch stattfindet, sagt aber: „verschicke nichts Peinliches." Verfügbare Ressourcen: 2 Backend-Ingenieure (mittleres Niveau, mit dem Reporting-Service nicht vertraut), 1 Senior-Frontend-Ingenieur, 1 QA-Ingenieur, 1 Technical Writer, 1 Produktmanager (du), Zugriff auf ein Feature-Flag-System, eine Staging-Umgebung und Kundensupport-Mitarbeitende. Erstelle einen konkreten, sequenzierten 72-Stunden-Aktionsplan, der bis Freitag 17:00 das bestmögliche erreichbare Ergebnis liefert. Dein Plan muss enthalten: - Eine Timeline, aufgeteilt in klare Zeitblöcke (mit ungefähren Uhrzeiten über Di-Abend, Mi, Do, Fr). - Konkrete Verantwortliche für jede Aktion (nach Rolle). - Entscheidungs-Punkte / Go-No-Go-Gates mit expliziten Kriterien. - Ein priorisiertes Risikoregister (Top 4–6 Risiken) mit Minderungsmaßnahmen und Notfallplänen. - Einen Kommunikationsplan, der CEO, die 3 Enterprise-Kunden, die breitere 40k-E-Mail-Liste und interne Mitarbeitende abdeckt — einschließlich dessen, was zu sagen ist, falls du verschieben musst oder nur einen teilweisen Launch machst. - Eine klar formulierte Empfehlung: voller Launch, teilweiser/gefilterter Launch oder verschobener Launch, mit Begründung, die an deine Restriktionen anknüpft. Halte den Plan realistisch und umsetzbar. Vermeide generische Ratschläge; verknüpfe jede Maßnahme mit den oben genannten Restriktionen.

194
09 May 2026 09:41

Planung

Anthropic Claude Opus 4.7 VS OpenAI GPT-5.2

Aktionsplan für den Nachbarschaftsputztag

Erstellen Sie einen umfassenden Aktionsplan, um einen Nachbarschaftsputztag zu organisieren. Der Plan sollte eine Schritt-für-Schritt-Anleitung für Ihr kleines Organisatorenteam sein und die vier Wochen bis zum Ereignis abdecken. Ihr Plan muss einen detaillierten Zeitplan der Aufgaben, eine Aufschlüsselung des Budgets, eine Strategie zur Gewinnung von mindestens 20 freiwilligen Helfern am Veranstaltungstag sowie einen Abschnitt zu potenziellen Risiken und deren Minderungsstrategien enthalten.

344
19 Apr 2026 06:28

Planung

Google Gemini 2.5 Flash-Lite VS Anthropic Claude Sonnet 4.6

Wiederherstellungsplan bei Stromausfall für eine kleine Klinik

Sie beraten eine kleine ambulante Klinik, nachdem ein nächtlicher Sturm einen kompletten Stromausfall verursacht hat. Die Klinik öffnet für Patienten um 8:00 Uhr, und es ist jetzt 6:00 Uhr. Erstellen Sie einen praktischen Aktionsplan für die nächsten 6 Stunden, der die Entscheidungen und Aufgaben der Klinik sequenziert. Klinikfakten: - Die Klinik hat bis 6:30 Uhr vor Ort: 1 Arzt, 2 Pflegekräfte, 1 Empfangsmitarbeiter und 1 Hausmeister. - Ein Notstromaggregat kann nur essentielle Verbraucher für insgesamt bis zu 4 Stunden vor Betankung mit Energie versorgen. Es kann entweder: Option A: Impfstoffkühlschrank + Notbeleuchtung + Internet-Router unterstützen, oder Option B: 2 Untersuchungszimmer + Notbeleuchtung + grundlegender Check-in-Computer. Es kann nicht beide Optionen gleichzeitig versorgen. - Der Impfstoffkühlschrank muss so lange mit Strom versorgt bleiben, dass Verderb vermieden wird; sobald er kumulativ 30 Minuten oberhalb seiner sicheren Temperaturgrenze liegt, müssen alle Impfstoffe verworfen werden. - Der Internetdienst funktioniert nur, wenn der Router Strom hat. - Wasser ist verfügbar, aber die Telefonanlage ist ausgefallen; das Personal kann private Mobiltelefone nutzen. - Zwischen 8:00 Uhr und 12:00 Uhr sind 18 Patienten terminiert: - 5 routinemäßige Nachuntersuchungen - 4 Impftermine - 3 dringende, aber nicht lebensbedrohliche Besuche - 2 Abholungen von Laborproben, die vor 11:00 Uhr erfolgen müssen - 4 Telemedizin-Konsultationen, die Internet benötigen - Eine nahegelegene Apotheke ist ab 9:00 Uhr geöffnet. - Der Kraftstofflieferant schätzt eine Betankung frühestens um 10:30 Uhr, dies ist aber nicht garantiert. - Eine Pflegekraft ist darin geschult, Impfstofftemperaturen zu überwachen und Impfungen durchzuführen; die andere ist nicht geschult. - Der Arzt kann persönliche Untersuchungen oder Telemedizin durchführen, aber nicht beides gleichzeitig. Ihr Plan muss: - Den Zeitraum von 6:00 Uhr bis 12:00 Uhr abdecken - Die Patientensicherheit, rechtliche/klinische Umsetzbarkeit und die Minimierung von Dienstunterbrechungen priorisieren - Entscheiden, wann das Aggregat eingesetzt wird und welche Option zu welchen Zeiten mit Strom versorgt wird, falls überhaupt - Patiententermine bei Bedarf neu priorisieren oder verschieben - Verantwortlichkeiten den verfügbaren Personalrollen zuweisen - Mindestens 3 wesentliche Risiken oder Ausfallpunkte sowie deren Handhabung enthalten - Realistisch mit Unsicherheit umgehen und vermeiden, zusätzliches Personal oder nicht vorhandene Ausrüstung anzunehmen Formulieren Sie die Antwort als schrittweisen operativen Aktionsplan.

291
10 Apr 2026 09:41

Planung

Anthropic Claude Haiku 4.5 VS OpenAI GPT-5.4

Startplan für Food Truck

Sie sind ein angehender Unternehmer mit einer großartigen Idee für einen Gourmet-Grilled-Cheese-Foodtruck. Sie haben kulinarische Erfahrung, aber nur begrenzte betriebswirtschaftliche Kenntnisse. Ihr gesamtes Startkapital beträgt $25,000, und Sie möchten innerhalb von 3 Monaten im fiktiven mittelgroßen Ort Maple Creek betriebsbereit sein. Erstellen Sie einen detaillierten, 3-Monats-Aktionsplan, der den Zeitraum von heute bis zu Ihrem ersten Verkaufstag abdeckt. Der Plan sollte nach Monaten gegliedert sein und die folgenden Schlüsselbereiche abdecken: 1. Rechtliches & Genehmigungen: Geschäftsregistrierung, Lizenzen, Gesundheitsgenehmigungen. 2. Fahrzeug & Ausstattung: Beschaffung und Kauf eines gebrauchten Foodtrucks, Ausstattung mit notwendiger Küchenausrüstung. 3. Speisekarte & Beschaffung: Finalisierung der Speisekarte, Identifizierung und Aufbau von Beziehungen zu lokalen Lieferanten. 4. Marketing & Branding: Erstellung eines Markennamens und Logos, Einrichtung von Social Media, Planung einer Eröffnungsveranstaltung. 5. Finanzen: Budgetzuweisung für alle wichtigen Ausgabenkategorien. Identifizieren Sie abschließend die drei wichtigsten potenziellen Risiken für Ihren Startplan und schlagen Sie für jedes eine konkrete, praktische Minderungsstrategie vor.

350
24 Mar 2026 09:43

Planung

Google Gemini 2.5 Flash-Lite VS OpenAI GPT-5.4

Notfallplan für Büroumzug unter Budget- und Zeitbeschränkungen

Sie sind der Betriebsleiter eines 45-köpfigen Softwareunternehmens. Aufgrund eines plötzlichen Sicherheitsverstoßes im Gebäude hat Ihnen Ihr Vermieter genau 10 Werktage eingeräumt, um Ihr aktuelles Büro zu räumen. Sie müssen das gesamte Unternehmen umziehen und dabei die Betriebsunterbrechung möglichst gering halten. Hier sind Ihre Einschränkungen: - Budget: $18,000 insgesamt für den Umzug (Umzugsfirma, temporäre Lösungen, Einrichtungskosten) - 10 Werktage, um vollständig zu räumen (unverhandelbar; Strafen von $2,000/Tag nach Ablauf) - Sie haben bereits einen Mietvertrag für neue Büroräume unterschrieben, aber diese benötigen 3 Tage IT-Infrastruktureinrichtung (Netzwerkverkabelung, Installation des Server-Racks), bevor dort gearbeitet werden kann - Ihr Unternehmen hat 3 kritische Kundentermine innerhalb des 10-Tage-Zeitraums: Tag 3, Tag 6 und Tag 9 - Sie haben 12 Entwickler, die duale Monitor-Setups und VPN-Zugang benötigen, um remote zu arbeiten, aber nur 8 Firmen-Laptops für Remote-Arbeit verfügbar sind - Die von Ihnen bevorzugte Umzugsfirma ist nur an den Tagen 5–6 oder 8–9 verfügbar (jeweils zweitägiger Auftrag) - Ihr Serverraum enthält 4 physische Server, die professionelle Handhabung und 6 Stunden Ausfallzeit für die Migration erfordern - Ein Teammitglied (Ihr IT-Leiter) ist an den Tagen 1–3 im Urlaub und kann nicht zurückgeholt werden Erstellen Sie einen detaillierten Tagesplan für den Umzug (Tage 1 bis 10), der alle oben genannten Einschränkungen berücksichtigt. Geben Sie für jeden Tag die wichtigsten Maßnahmen, verantwortliche Personen und mögliche Risiken an. Fügen Sie außerdem einen Notfallplan für den wahrscheinlichsten Ausfallpunkt hinzu, den Sie identifizieren. Erklären Sie Ihre Begründung für die Reihenfolge der von Ihnen gewählten Maßnahmen.

331
23 Mar 2026 08:53

Verwandte Links

X f L