
Das Schweizer Startup LogicStar ist entschlossen, am Spiel der KI-Agenten teilzunehmen. Das im Sommer 2024 gegründete Startup hat 3 Millionen US-Dollar an Vorgründungsförderung erhalten, um Werkzeuge auf den Entwicklermarkt zu bringen, die die autonome Wartung von Softwareanwendungen ermöglichen, anstatt den häufigeren Anwendungsfall von KI-Agenten für die Code-Mitentwicklung.
LogicStar CEO und Mitbegründer Boris Paskalev deutet an, dass die KI-Agenten des Startups letztendlich mit Code-Entwicklungsagenten zusammenarbeiten könnten - wie beispielsweise Cognition Labs' Devin - in einem geschäftlichen Win-Win-Szenario.
Bei der KI-Agenten, die Software erstellen und bereitstellen, ist das Treueproblem genauso relevant wie bei menschlichen Entwicklern, und LogicStar möchte durch automatisches Erkennen und Beheben von Fehlern in bereitgestelltem Code dazu beitragen, das Entwicklungsrädchen zu schmieren.
Nach Ansicht von Paskalev sind selbst die besten Modelle und Agenten da draußen nicht in der Lage, die Mehrheit der ihnen vorgelegten Fehler zu lösen - daher sieht das Team die Möglichkeit für ein KI-Startup, das darauf spezialisiert ist, diese Quoten zu verbessern und den Traum von weniger mühsamer App-Wartung zu verwirklichen.
Zu diesem Zweck bauen sie auf großen Sprachmodellen (LLMs) auf - wie OpenAIs GPT oder sogar Chinas DeepSeek - und verfolgen einen modellagnostischen Ansatz für ihre Plattform. Dies ermöglicht es LogicStar, auf verschiedene LLMs zuzugreifen und die Nützlichkeit seiner KI-Agenten zu maximieren, basierend darauf, welches Grundmodell am besten funktioniert, um ein bestimmtes Codeproblem zu lösen.
Paskalev behauptet, dass das Gründungsteam das technische und domänenspezifische Wissen hat, um eine Plattform zu bauen, die Programmierprobleme lösen kann, die große Sprachmodelle allein herausfordern oder überlisten können. Sie können auch auf bisherigen unternehmerischen Erfolg verweisen: Er verkaufte sein früheres Code-Review-Startup, DeepCode, im September 2020 an den Cybersicherheitsriesen Snyk.
„Am Anfang dachten wir tatsächlich daran, ein großes Sprachmodell für Code zu bauen“, sagte er TechCrunch. „Dann wurde uns bewusst, dass das schnell zu einem Handelsgut werden würde… Jetzt bauen wir davon ausgehend, dass all diese großen Sprachmodelle da sind. Vorausgesetzt, es gibt tatsächlich einige vernünftige [KI]-Agenten für Code, wie extrahieren wir den maximalen geschäftlichen Wert daraus?“
Er sagte, dass die Idee auf dem Verständnis des Teams beruht, wie Softwareanwendungen analysiert werden. „Kombinieren Sie das mit großen Sprachmodellen - dann konzentrieren Sie sich auf das Begründen und Überprüfen dessen, was diese großen Sprachmodelle und der KI-Agent tatsächlich vorschlagen.“
Testgetriebene Entwicklung
Was bedeutet das in der Praxis? Paskalev sagt, LogicStar führt eine Analyse jeder Anwendung durch, auf der seine Technologie eingesetzt wird - unter Verwendung „klassischer Informatikmethoden“ -, um eine „Wissensdatenbank“ aufzubauen. Dies gibt dem KI-Agenten eine umfassende Karte der Eingaben und Ausgaben der Software; wie Variablen mit Funktionen verknüpft sind; und andere Verknüpfungen und Abhängigkeiten usw.
Dann kann der KI-Agent für jeden Fehler, mit dem er konfrontiert wird, bestimmen, welche Teile der Anwendung betroffen sind - sodass LogicStar die Funktionen eingrenzen kann, die simuliert werden müssen, um Dutzende potenzieller Fixes zu testen.
Nach Paskalev ermöglicht diese „minimierte Ausführungsumgebung“ dem KI-Agenten, „Tausende“ von Tests durchzuführen, um Fehler zu reproduzieren und einen „fehlerhaften Test“ zu identifizieren und - durch diesen „testgetriebenen Entwicklung“-Ansatz - schließlich eine Lösung zu finden, die beständig ist.
Er bestätigt, dass die tatsächlichen Fehlerkorrekturen aus den LLMs stammen. Aber weil die Plattform von LogicStar diese „sehr schnelle Ausführungsumgebung“ ermöglicht, können ihre KI-Agenten im großen Maßstab arbeiten, um die Spreu vom Weizen, sozusagen, zu trennen und den Nutzern eine Abkürzung zu dem Besten zu bieten, was LLMs bieten können.
„Was wir sehen, ist [LLMs sind] großartig für Prototyping, Testen von Dingen usw., aber sie sind absolut nicht großartig für [Code]-Produktion, kommerzielle Anwendungen. Ich glaube, wir sind noch weit davon entfernt, und das ist es, was unsere Plattform bietet“, argumentierte er. „Um diese Fähigkeiten der Modelle heute extrahieren zu können, können wir tatsächlich sicher kommerziellen Wert extrahieren und Entwicklern Zeit sparen, sich wirklich auf die wichtigen Dinge zu konzentrieren.“
Unternehmen sollen das erste Ziel von LogicStar sein. Seine „Silicon Agents“ sind dazu gedacht, neben Unternehmensentwicklungsteams zu arbeiten, wenn auch zu einem Bruchteil des Gehalts, das erforderlich wäre, um einen menschlichen Entwickler einzustellen, und übernehmen eine Reihe von App-Wartungsaufgaben, die das Engineering-Talent für kreativere und/oder anspruchsvollere Arbeiten freisetzen. (Oder, nun ja, zumindest bis LLMs und KI-Agenten wesentlich leistungsfähiger werden.)
Obwohl das Start-up damit wirbt, über eine „vollständig autonome“ App-Wartungsfähigkeit zu verfügen, bestätigt Paskalev, dass die Plattform menschlichen Entwicklern erlauben wird, die von seinen KI-Agenten aufgerufenen Fixes zu überprüfen (und anderweitig zu beaufsichtigen). Vertrauen muss also zuerst verdient werden.
„Die Genauigkeit, die ein menschlicher Entwickler erreicht, liegt zwischen 80 und 90 %. Unser Ziel [für unsere KI-Agenten] ist es, genau dort zu sein“, fügt er hinzu.
Es sind noch frühe Tage für LogicStar: Eine Alpha-Version seiner Technologie wird derzeit mit einer Reihe von ungenannten Unternehmen getestet, die Paskalev als „Design-Partner“ bezeichnet. Derzeit unterstützt die Technologie nur Python - aber Erweiterungen auf Typescript, Javascript und Java sind als „bald verfügbar“ angekündigt.
„Das Hauptziel [mit der Vorgründungsfinanzierung] ist es, zu zeigen, dass die Technologie mit unseren Design-Partnern funktioniert - mit Fokus auf Python“, fügt Paskalev hinzu. „Wir haben bereits ein Jahr damit verbracht und haben viele Möglichkeiten, uns tatsächlich zu erweitern. Und deshalb versuchen wir uns zunächst darauf zu konzentrieren, den Wert in einem Fall zu zeigen.“
Das Pre-Seed-Raising des Startups wurde von dem europäischen VC-Unternehmen Northzone angeführt, und Angel-Investoren von DeepMind, Fleet, Sequoia Scouts, Snyk und Spotify haben sich ebenfalls an der Runde beteiligt.
In einer Erklärung sagte Michiel Kotting, Partner bei Northzone: „KI-gesteuerte Codegenerierung steckt noch in den Anfängen, aber die Produktivitätsgewinne, die wir bereits sehen, sind revolutionär. Das Potenzial dieser Technologie, Entwicklungsvorgänge zu optimieren, Kosten zu senken und Innovationen zu beschleunigen, ist immens, und das umfassende technische Fachwissen und die nachgewiesene Erfolgsbilanz des Teams bringen sie in die Lage, echte und nachhaltige Ergebnisse zu erzielen. Die Zukunft der Softwareentwicklung wird umgestaltet, und LogicStar wird eine wichtige Rolle in der Softwarewartung spielen.“
LogicStar führt eine Warteliste für potenzielle Kunden, die ihr Interesse an einem frühen Zugang bekunden möchten. Es wurde uns mitgeteilt, dass eine Beta-Version später in diesem Jahr geplant ist.