ChemAudit: Eine Open-Source-Suite zur Validierung chemischer Strukturen

Die Datenqualität in der Chemie bleibt einer der größten Engpässe in den Bereichen Cheminformatik, Arzneimittelforschung und maschinelles Lernen für die Chemie. Probleme wie falsche Strukturabbildungen, undefinierte Stereozentren, mit PAINS gekennzeichnete1 Verbindungen und inkonsistente Standardisierung können die Zuverlässigkeit nachgelagerter Modelle und Analysen unbemerkt untergraben.

ChemAudit wurde entwickelt, um dieses Problem zu lösen. Es handelt sich um eine kostenlose Open-Source-Webplattform, die Strukturvalidierung, Standardisierung, strukturelle Warnungsüberprüfung und Qualitätsbewertung in einer übersichtlichen, benutzerfreundlichen Oberfläche vereint. Es sind keine Kenntnisse im Umgang mit der Befehlszeile erforderlich.

Was es macht:

  • Führt mehr als 15 Validierungsprüfungen durch, darunter Parsbarkeit, Valenz, Stereochemie und Konsistenz der Darstellung.
  • Überprüft mehr als 480 PAINS-Muster und mehr als 700 pharmazeutische Warnfilter von BMS, Glaxo, Dundee und anderen ChEMBL2-Sammlungen.
  • Bewertet die ML-Bereitschaft (0–100) durch Testen von 451 molekularen Deskriptoren und 7 Fingerabdrucktypen.
  • Bewertet die Arzneimittelähnlichkeit anhand der Regeln von Lipinski3, QED4, Veber5, Ghose6 und Muegge 7.
  • Prognostiziert ADMET-Eigenschaften, einschließlich synthetischer Zugänglichkeit, Löslichkeit und ZNS-Penetration.
  • Standardisiert Strukturen mithilfe der ChEMBL-Pipeline8 (Salzabtrennung, Tautomer-Kanonisierung, Ladungsnormalisierung)
  • Bewertet die Ähnlichkeit von Naturprodukten mit Hilfe einer Gerüstanalyse

Auf Skalierbarkeit ausgelegt: Die Stapelverarbeitung unterstützt bis zu 1 Million Moleküle mit Echtzeit-Fortschrittsverfolgung über WebSocket. Die Ergebnisse können in die Formate CSV, Excel, SDF, JSON und PDF exportiert werden.

Built on proven tools: RDKit9, MolVS10, and the ChEMBL structure pipeline power the backend. React and RDKit.js deliver interactive 2D depictions with atom-level issue highlighting on the frontend.

ChemAudit wurde für Datenbankverwalter, ML-Forscher, Medizinchemiker und Naturstoffwissenschaftler entwickelt, die zuverlässige, standardisierte chemische Daten benötigen, ohne unterschiedliche CLI-Tools zusammenfügen oder kommerzielle Software lizenzieren zu müssen.

Selbst gehostet und unter MIT-Lizenz. Probieren Sie es aus, zerlegen Sie es, erweitern Sie es.

Erhältlich unter: