Spartan – Spartan Datenbanken

Datenbanken

Spartan enthält Zugang zu verschiedenen, nützlichen molekularen Datenbanken, inklusive:

  • Spartan Spectra & Properties Database (SSPD),
  • Spartan Molecular Database (SMD),
  • Cambridge Structural Database* (CSD) und
  • Protein Data Bank** (PDB).

*CSD muss separat lizenziert werden.
**PDB-Zugang benötigt Internetkonnektivität.

Spartan Spectra and Properties Database

Überblick

Exemplarisches Kugel-Stab-Modell mit angeschnittener Potentialfläche
Exemplarisches Kugel-Stab-Modell mit angeschnittener Potentialfläche

Die Spartan Spectra and Properties Database (SSPD) ist eine Sammlung von Infrarot-, Proton- und 13C- NMR-Spektren, zusammen mit einer Vielzahl an zugehörigen atomaren und molekularen Eigenschaften, QSAR-Deskriptoren und thermodynamischen Eigenschaften für ~250.000 Moleküle mit Molekulargewichten bis zu 500 amu. SSPD-Einträge wurden unter Verwendung von Gleichgewichtsgeometrien aus EDF2/6-31G*-Dichtefunktionalmodellen bestimmt, basierend auf der Geometrie mit der geringsten konformationellen Energie nach T1 "Thermochemical Recipes". Die Wellenfunktion ist in jedem Eintrag inkludiert, was eine Berechnung in Echtzeit verschiedener grafischer Oberflächen und Eigenschaftskarten erlaubt. Auf die SSPD wird von Spartan aus über Substruktur, Name, Formel bzw. die beste Übereinstimmung oder ein unbekanntes (experimentelles) Infrarotspektum zugegriffen. Zusätzlich sind Ergebnisse unverzüglich zugänglich für Moleküle, die erzeugt oder importiert worden sind und für die ein Datenbankeintrag existiert.

Erweiterungen und Updates

Die SSPD kann seit Version 10 mit Benutzerdaten, die über Spartan gewonnen wurden, ergänzt werden. Die SSPD wird mindestens einmal im Jahr auf den neuesten Stand gebracht. Das letzte durchgeführte Update auf Version 3.0 (November 2014) hat die Anzahl der Einträge von ~172.000 auf mehr als 250.000 erhöht.

NMR-Spektren

13C-chemische Verschiebungen, die über das EDF2/6-31G*-Modell berechnet wurden, wurden empirisch korrigiert, um die lokale Umgebung (Bindungsanzahl und -ordnung) zu berücksichtigen. Basierend auf Vergleichen einer großen Auswahl organischer Moleküle senkt dies den RMS-Fehler von 5,5 ppm auf 1,8 ppm bezogen auf experimentelle Werte. Unkorrigierte chemische 13C-Verschiebungen sind verfügbar. Chemische Verschiebungen für Protonen und andere Kerne, z.B. 19F, sind verfügbar. Die 3J-HH-Kopplungskonstanten werden empirisch basierend auf der 3D-Geometrie abgeschätzt. Proton-, 13C- und 13C DEPT-Spektren sowie COSY-, HSQC- und HMBC-Spektren können angezeigt werden. Chemische Verschiebungen für andere Kerne können als Etiketten am Strukturmodell angezeigt werden.

Berechnetes HMBC-NMR-Spektrum für Ciproflaxin
Berechnetes HMBC-NMR-Spektrum für Ciproflaxin. Das 2D-Spektrum wurde unter Verwendung berechneter chemischer Verschiebungen für 13C und Protonen zusammen mit der Kenntnis der molekularen Geometrie erzeugt
DEPT-NMR-Spektrum für Caulophyllin
Berechnetes (rot) gegen gemessenes (schwarz) DEPT-NMR-Spektrum für Caulophyllin.

Infrarot-Spektren

Infrarot-Frequenzen, berechnet mit dem EDF2/6-31G*-Dichtefunktionalmodell, wurden einheitlich skaliert, um einem systematischen Fehler hauptsächlich aufgrund der harmonischen Annäherung Rechnung zu tragen. Die Spektrallinien wurden verbreitert, um die endliche Temperatur und somit die hauptsächlich rotatorischen Strukturen zu berücksichtigen, welche typischerweise in guter Übereinstimmung mit experimentellen Daten sind.

Errechnetes, skaliertes Infrarot-Spektrum basierend auf dem EDF2/6-31G*-Dichtefunktionalmodell
Errechnetes, skaliertes Infrarot-Spektrum basierend auf dem EDF2/6-31G*-Dichtefunktionalmodell (rot) und berechnetes Spektrum (schwarz)
SIRD-Datenbank-Eintrag für cis-6-Methyl-3,5-diphenyl-2-cyclohexenon
SIRD-Datenbank-Eintrag für cis-6-Methyl-3,5-diphenyl-2-cyclohexenon in Folge der Suche nach 3-Methyl-4-phenyl-3buten-2-on

Die SSPD kann, wie bei einer Datenbank mit experimentellen Werten, nach der höchsten Übereinstimmung für ein unbekanntes Infrarotspektrum durchsucht werden. Dabei werden Frequenzbereich und die Peakhöhe bei halber Breite als Parameter behandelt.

Atomare und molekulare Eigenschaften, QSAR-Deskriptoren und thermodynamische Größen

Die in der SSPD beinhalteten Größen sind die Geometrie, Fläche, Volumen und Ovalität zugänglicher Bereiche, Energie, Bildungswärme anhand des "T1 Thermochemical Recipe", Nullpunktsenergie, HOMO- und LUMO-Energien, Solvatationsenergie in wässriger Umgebung abgeschätzt anhand des SM5.4-Modells und des Dipolmoments. Auch werden Abschätzungen der Anzahl an Konformeren und Tautomeren zur Verfügung gestellt.

Atomare Eigenschaften enthalten Mulliken- und natürliche Ladungen sowie Ladungen basierend auf Anpassungen an das elektrostatische Potential und chemische NMR-Verschiebungen. Zuordnungen der R/S-Chiralität werden auch an die Hand gegeben.

QSAR-Deskriptoren enthalten die polare Oberfläche und die zugängliche polare Oberfläche, beide auch basierend auf dem elektrostatischen Potenzial, den LogP aus dem Ghose-Crippen-Modell, Polarisierbarkeit, das Minimum und Maximum des elektrostatischen Potenzials und das Minimum des lokalen Ionisationspotenzials. Auch wird die Anzahl an Donoren und Akzeptoren für Wasserstoffbrückenbindungen zur Verfügung gestellt.

Es sind thermodynamische Größen enthalten wie Enthalpie, Entropie, Gibbs-Energie und Wärmekapazität als Funktion der Temperatur.

Grafische Darstellungen

Beispielhaftes Orbitalenergie-Diagramm
Beispielhaftes Orbitalenergie-Diagramm

Molekulare Orbitale (inklusive HOMO und LUMO), Elektronendichteoberflächen sowie elektrostatische Potenzialkarten, lokale Ionisationspotenzialkarten und eine LUMO-Karte sind unter den in Echtzeit erzeugbaren grafischen Darstellungen. Dies ist möglich, da jeder SSPD-Eintrag die Wellenfunktion enthält (entsprechend EDF2/6-31G*-Dichtefunktionalmodell).

HOMO von Zimtsäure
HOMO von Zimtsäure

Nachfolgend ist eine elektrostatische Potenzialkarte für Vitamin A gezeigt, die hydrophile Bereiche in rot (negatives Potenzial) und hydrophobe Bereiche in blau (positives Potenzial) hervorhebt.

Elektrostatische Potenzialkarte für Vitamin A
Elektrostatische Potenzialkarte für Vitamin A

Die folgende Abbildung zeigt eine lokale Ionisationspotenzialkarte für ein bizyklisches Dien. Sie weist auf zwei wahrscheinliche elektrophile Angriffsstellen hin: Zum einen auf die Doppelbindung des sechsgliedrigen Ringes syn zu den beiden Alkylgruppen und zum anderen auf die Doppelbindung des fünfgliedrigen Ringes anti zu den beiden Alkylgruppen. Die sterische Behinderung (wie durch die überlagerten Punkte angedeutet) ist weniger groß bei einem Angriff auf den fünfgliedrigen Ring. Dieses Ergebnis ist konsistent mit dem bevorzugten Epoxidationsprodukt.

Lokale Ionisationspotenzialkarte für ein bizyklisches Dien
Lokale Ionisationspotenzialkarte für ein bizyklisches Dien

Die LUMO-Karte im nächsten Bild zeigt, dass ein möglicher, nukleophiler Angriff auf das niedrigste, unbesetzte molekulare Orbital von trans-2-decalone von der axialen Seite der Carbonylgruppe (links) wahrscheinlicher ist als von der äquatorialen Seite (rechts).

LUMO-Karte
LUMO-Karte

Data Mining

Die Informationen in der SSPD können durchsucht und Trends in den berechneten Eigenschaften untersucht werden, wodurch Beziehungen zwischen den verschiedenen Eigenschaften offensichtlich werden. X/Y-Graphen und Histogramme können aus den gefundenen Daten erstellt werden und multivariable Regressionsanalysen durchgeführt werden. Die SSPD ist ein mächtiges Werkzeug zum Aufstellen und Testen von Hypothesen.

Der im nachfolgenden Bild (unten) gezeigte Graph veranschaulicht eindrucksvoll, dass die chemische Verschiebung von 19F in p-substituierten Fluorobenzenen mit der 13C-Verschiebung des an das Fluor gebundenen Kohlenstoffatoms einhergeht. Über 900 Datenpunkte sind verfügbar, die einen Bereich der chemischen Verschiebung von 19F über nahezu 50 ppm aufspannen.

Graph der chemischen Verschiebung von 19F in p-substituierten Fluorobenzenen mit der 13C-Verschiebung
Graph der chemischen Verschiebung von 19F in p-substituierten Fluorobenzenen mit der 13C-Verschiebung

Auch bei Vergleichen von Bindungslängen kann die SSPD helfen. Im nächsten Bild ist beispielhaft die Häufigkeit gegen die C-C-Bindungslänge der zentralen Bindung zwischen den fusionierten Ringen dargestellt. Wieder ist auf einen Blick zu erkennen, dass die Bindungslänge für eine Auswahl von 1.000 verschieden substituierten Naphtalenen, die in der SSPD enthalten sind, kaum variiert.

Beispielhafte Häufigkeit gegen die C-C-Bindungslänge der zentralen Bindung zwischen den fusionierten Ringen
Beispielhafte Häufigkeit gegen die C-C-Bindungslänge der zentralen Bindung zwischen den fusionierten Ringen

Spartan Molecular Database

Überblick

Ein Teil der Spartan Molecular Database (SMD) ist beim Kauf einer jeden Spartan-Lizenz inklusive. Die SMD stellt den Nutzern signifikante Werkzeuge zur Verfügung.

Die SMD bietet den Nutzern eine umfangreiche Sammlung von Strukturen, Energien und Eigenschaften für ca. 150 000 Moleküle, die mit Hilfe von bis zu 10 quantenchemischen Modellen inklusive Hartree-Fock, B3LYP, Dichtefunktional und MP2-Modellen berechnet wurden. Eine limitierte Menge an Daten werden basierend auf G3(MP2)-"Thermochemical Recipes" zur Verfügung gestellt.

Die SMD wird automatisch beim Erstellen (oder Importieren) eines Moleküls abgefragt. Ist das Molekül in der Datenbank vorhanden, wird sein Name in der unteren rechten Ecke des Spartan-Interfaces angezeigt. Die Nutzer können ihr erzeugtes oder importiertes Molekül mit dem SMD-Eintrag ersetzen und das mittels Knopfdruck auf den Pfeil neben dem Namen und anschließender Wahl der passenden QM-Modellstruktur.

Alle so bezogenen Daten enthalten den Molekülnamen, das Molekulargewicht, die Punktgruppe, die Oberfläche, das molekulare Volumen in der Gasphase, Energie, Solvatationsenergie für wässrige Lösungen, Energie des HOMOs sowie LUMOs, das Dipolmoment und die Ladung der Atome.

Die SMD bietet zusätzlich einen durchsuchbares Speicherformat für Berechnungen. Nutzer können Sammlungen von Molekülen, die mit ihren Forschungsprojekten assoziiert sind, importieren oder erstellen. Diese Sammlungen können dann anstatt oder in Kombination mit der SMD durchsucht werden, was eine komprimierte, auf die Wünsche zugeschnittene Bibliothek mit 3D-Strukturen und einem Host für berechnete Eigenschaften bedeutet.

Suche über Struktur

Die voreingestellte Suchmethode der SMD basiert auf der Suche über Strukturen. Dazu muss in Spartans "Builder" ein Strukturfragment erzeugt werden. Im Beispiel (siehe unten) wurde das Molekül "Indol" mit Resten an den Positionen 2, 3 und 6 verwendet, um eine Substruktursuche für T1-Bildungswärmedaten durchzuführen. Das Klicken auf eine freie Bindungsstelle führt zu einer orangen Markierung, die es als Anknüpfungspunkt kennzeichnet, und eine korrespondierende Suche zeigt alle Einträge mit jeglichen Fragmenten, die an dieser Stelle als Reste (inklusive Wasserstoffatomen) angehängt sind.

Suche nach Name

Um in der SMD eine Suche über einen Molekülnamen durchzuführen, muss ein theoretisches Modell spezifiziert und "Search by Name" im "Search Options"-Dialog ausgewählt werden. Dort kann dann einfach der gesamte oder ein Teil des Molekülnamens eingefügt werden. Hier im Beispiel sieht man, dass eine Suche nach allen DFT B3LYP/6-31G*-Einträgen für den Namen Anthracen 187 Einträge liefert.

Suche über Formel

Suchanfragen über die Summenformel können durch die Spezifikation der theoretischen Modelle und Auswahl des Menüpunkts "Search by Formula" im "Search Options"-Dialog gestartet werden. Anschließend muss nur noch die Summenformel ins Suchfeld "Search by Text" eingegeben werden. Im folgenden Beispiel wurden die Moller-Plesset-Einträge (MP2/6-31G*) für C6H6 gesucht, was zu einem Gesamtergebnis von 19 Einträgen führt, entweder Konformere oder strukturelle Isomere von C6H6. Gezeigt ist Fulven.

Suche über Gewicht

Eine Suche über das molekulare Gewicht wird durch die Auswahl des theoretischen Modells und die Auswahl des Menüpunkts "Search by Weight" im "Search Options"-Dialog gestartet. Anschließend muss nur noch das Molekulargewicht in das Suchfeld eingegeben werden. Im folgenden Beispiel wurden alle DFT EDF1/6-31G*-Einträge für ein Molekulargewicht von 164,157 g/mol, dem Molekulargewicht von 2-Deoxy-D-Glukose, gesucht.

Suche nach Isomeren

Um nach Isomeren eines Moleküls zu suchen, erstellen Sie einfach das gewünschte Molekül, wählen Sie ein oder mehrere theoretische Modelle aus und wählen Sie den Menüpunkt "Search by Isomer" im "Search Options"-Dialog. Im folgenden Beispiel wurde 1,5-Dihydroxynaphthalen erzeugt und in der SMD auf der Hartree-Fock 3-21G*-Ebene durchsucht. Das Ergebnis sind 34 Isomere, darunter meta-Chlorperbenzoesäure.

Protein Database

Die Protein Data Bank (PDB) wird von der Organisation "Worldwide Protein Data Bank" überwacht und setzt sich aus vier Mitgliedern zusammen, dem gemeinnützigen "Research Collaboratory for Structural Bioinformatics Protein Database" (RCSB PDB), der "Protein Data Bank in Europe" (PDBe), der "Protein Data Bank Japan" (PDBj) und der "Biological Magnetic Resonance Data Bank" (BMRB). Derzeit archiviert die RCSB PDB alle an Sie zur Verfügung gestellten Daten. Die PDB ist eine fantastische Quelle für Strukturdaten biologischer Makromoleküle. Während die Software von Wavefunction stark in der Quantenchemie verwurzelt ist und so den Fokus auf kleine Moleküle (Medikamente und kleiner) gerichtet hat, stellt die PDB eine exzellente Quelle für Informationen über die Interaktion kleiner mit großen Molekülen dar.

Cambridge Structural Database

Die "Cambrige Structural Database" (CSD) ist das Hauptprodukt des "Cambridge Crystallographic Data Centre" (CCDC) und liegt im Fokus des CSD-Systems, welches unter anderem Software für den Datenbankzugriff, die Strukturvisualisierung und die Datenanalyse sowie die Ableitung struktureller Wissensgrundlagen aus der CSD umfasst.

Die CSD hält bibliographische, chemische und kristallographische Informationen fest und das für

  • organische Moleküle und
  • metallorganische Verbindungen

dessen 3D-Strukturen bestimmt wurden unter Verwendung von

  • Röntgenbeugung oder
  • Neutronenbeugung

Die CSD-Aufzeichnungen sind Ergebnisse von

  • Einkristallstudien und
  • Röntgenpulverdiffraktometriestudien,

welche die 3D-Koordinaten für mindestens alle Atome, die schwerer als Wasserstoff sind, liefern. In manchen Fällen ist die CCDC nicht in der Lage, entsprechende Koordinaten zu erhalten, und unvollständige Einträge verbleiben in der CSD.

Die CSD enthält Kristallstrukturdaten aus

  • frei zugänglichen Veröffentlichungen und
  • privaten Korrespondenzen zur CSD, die direkt dort abgelegt wurden.

Das CSD-System enthält auch IsoStar, eine Wissenssammlung über die intermolekularen Wechselwirkungen, wobei sie Daten enthält, die aus den Datenbanken CSD und PDB abgeleitet sind.

© ADDITIVE GmbH. Alle Rechte, Irrtümer und Änderungen vorbehalten.

Impressum  /  Datenschutz  /  AGB