Kaptnkek
Profi
Thread Starter
- Mitglied seit
- 20.03.2022
- Beiträge
- 304
- Desktop System
- Monolith
- Details zu meinem Desktop
- Prozessor
- Intel i5 13600K
- Mainboard
- MSI z790 Pro Wifi P
- Kühler
- Aquacomputer cuplex kryos NEXT / Mora 420 / 2x 360 mm Radiator/ Ultitube D5 NEXT Pro 200 mm
- Speicher
- 2x 16 Gb Corsair Vengence DDR5 5600 CL36
- Grafikprozessor
- Rx 6900 XT Reference @ Watercooling Alphacool Aurora Acryl
- Display
- Corsair Xeneon 32QHD165 ( 32" , IPS , 1440p 165hz ) + 2 x HP Compaq LA2206xc ( 22 " 1080p)
- SSD
- 1x M2 500 gb 1x SSD 500 gb
- Soundkarte
- Fiio K5 Pro ESS
- Gehäuse
- Lian Li o11 Dynamic Evo
- Netzteil
- Corsair RMx 850
- Keyboard
- Corsair K100
- Mouse
- Corsair Ironclaw
- Betriebssystem
- Win 11
- Webbrowser
- Opera GX
- Sonstiges
- Bayerdynamic Dt 1770 Pro / NobleChair Hero Vaulttec Edition
- Internet
- ▼200 Mbit ▲50 Mbit
Moin zusammen,
ich habe ein kleines Open-Source Projekt entwickelt, das ich gerne teilen möchte: DirectShell.
Kurz gesagt: Es liest den Windows Accessibility Tree (die Schnittstelle die normalerweise für Screenreader gedacht
ist) und schreibt alle UI-Elemente einer Anwendung in eine SQLite-Datenbank. Damit kann man Programme per SQL abfragen
und auch Eingaben injizieren — oder als Proxy Abfangen und verändern. Es funktioniert soweit ich das sehe mit jeden Programm das WA nutzt was ~ +99% sein dürften.
Das Ganze ist in Rust geschrieben, ca. 1,2 MB groß, und läuft als Overlay das man auf beliebige Fenster "snapt".
Gedacht ist es vor allem als Baustein für Automatisierung und als Schnittstelle für KI-Agenten, aber auch für alle die
programmatisch mit Desktop-Anwendungen arbeiten wollen ohne auf OCR oder Pixel-Erkennung angewiesen zu sein.
Im Grunde ist es ein Primitivum das jedes X- Beliebige Programm Forked , Automatisch eine SQL Lite DB erstellt sowie weitere sub Dateien Generiert welche es :
- Jedweigen Scripten , Programmen , Code usw
- Sowie KI Modellen und Agenten
Ermöglicht Jedes Programm Nativ zu Lesen , Benutzen und zu Manipulieren.
Im Grunde ist es eine Automatisch entstehende art API unabhängig davon ob das Programm eine API besitzt. Es funktioniert also ebenfalls mit alter legecy Software oder Prioritären API Programmen.
Das wichtige ist dabei aber es " Hackt" nichts , ändert nichts , bricht ,keinerlei sicherheits Mechanismen und bricht damit keine TOS , AGB oder ein Gesetz.
und da die WA Schnitstelle in über 180 Ländern Rechtlich geschützt ist ist es auch nicht Patchbar.
Repo: https://github.com/IamLumae/DirectShell
Whitepaper: https://dev.to/tlrag/-directshell-i...niversal-app-interface-no-screenshots-no-2457 ( Volle Technische Version im Short Paper Verlinkt sowie ein Live Demo Video)
Lizenz: AGPL-3.0 also open source und free to use für alles und jeden der es nicht Kommerziell nutzen will.
Bin gespannt auf Feedback und Fragen. Ist natürlich noch Day 1 — es gibt genug Ecken und Kanten, aber die Grundlage
steht.
Grüße Martin
ich habe ein kleines Open-Source Projekt entwickelt, das ich gerne teilen möchte: DirectShell.
Kurz gesagt: Es liest den Windows Accessibility Tree (die Schnittstelle die normalerweise für Screenreader gedacht
ist) und schreibt alle UI-Elemente einer Anwendung in eine SQLite-Datenbank. Damit kann man Programme per SQL abfragen
und auch Eingaben injizieren — oder als Proxy Abfangen und verändern. Es funktioniert soweit ich das sehe mit jeden Programm das WA nutzt was ~ +99% sein dürften.
Das Ganze ist in Rust geschrieben, ca. 1,2 MB groß, und läuft als Overlay das man auf beliebige Fenster "snapt".
Gedacht ist es vor allem als Baustein für Automatisierung und als Schnittstelle für KI-Agenten, aber auch für alle die
programmatisch mit Desktop-Anwendungen arbeiten wollen ohne auf OCR oder Pixel-Erkennung angewiesen zu sein.
Im Grunde ist es ein Primitivum das jedes X- Beliebige Programm Forked , Automatisch eine SQL Lite DB erstellt sowie weitere sub Dateien Generiert welche es :
- Jedweigen Scripten , Programmen , Code usw
- Sowie KI Modellen und Agenten
Ermöglicht Jedes Programm Nativ zu Lesen , Benutzen und zu Manipulieren.
Im Grunde ist es eine Automatisch entstehende art API unabhängig davon ob das Programm eine API besitzt. Es funktioniert also ebenfalls mit alter legecy Software oder Prioritären API Programmen.
Das wichtige ist dabei aber es " Hackt" nichts , ändert nichts , bricht ,keinerlei sicherheits Mechanismen und bricht damit keine TOS , AGB oder ein Gesetz.
und da die WA Schnitstelle in über 180 Ländern Rechtlich geschützt ist ist es auch nicht Patchbar.
Repo: https://github.com/IamLumae/DirectShell
Whitepaper: https://dev.to/tlrag/-directshell-i...niversal-app-interface-no-screenshots-no-2457 ( Volle Technische Version im Short Paper Verlinkt sowie ein Live Demo Video)
Lizenz: AGPL-3.0 also open source und free to use für alles und jeden der es nicht Kommerziell nutzen will.
Bin gespannt auf Feedback und Fragen. Ist natürlich noch Day 1 — es gibt genug Ecken und Kanten, aber die Grundlage
steht.
Grüße Martin