Die TRANSFAC-Datenbank enthält eine umfassende Sammlung an Daten zu eukaryotischen Transkriptionsfaktoren, deren experimentell ermittelten DNA-Bindungsstellen sowie den davon regulierten Genen. Eigene Daten können mit den bereits vorhandenen Datensätzen verglichen und mögliche Bindungsstellen vorhergesagt sowie bezüglich ihrer Relevanz gewichtet werden. Zusätzlich sind eine Vielzahl an Hintergrundinformationen in sogenannten Reports zusammengefasst. Die einzelnen Tools sind miteinander verknüpft, so dass mit dem Ergebnis gleich mögliche Verknüpfungen zu regulierten Genen, damit zusammenhängenden Krankheiten oder übergeordneten regulatorischen Netzwerken verfügbar sind. Alle Informationen werden von Experten sorgfältig kuratiert und auf dem neuesten Stand gehalten. Damit ist die TRANSFAC-Datenbank gleichzeitig ein umfassendes Nachschlagewerk zur eukaryotischen Genregulation.
Der Aufbau der TRANSFAC-Datenbank
Die TRANSFAC-Datenbank ist in drei Bereiche aufgeteilt.
Die BKL-SEARCH-Funktion kann für die Suche nach bestimmten Keywords oder nach Themenbereichen genutzt werden. Somit steht dem Nutzer ein umfassendes, digitales Nachschlagewerk zur Verfügung, das immer auf dem neuesten Stand gehalten wird. Verschiedene BKL-Tools helfen dabei, die eigenen Daten auszuwerten, zu analysieren und in einen größeren Zusammenhang zu bringen.
Über das BKL-Data-Management können die eigenen Daten, Suchergebnisse und Analysen zentral abgelegt werden. BKL-Reports, die ebenfalls in der Datenbank hinterlegt sind, liefern datenspezifische Hintergrundinformationen. Der Nutzer kann auch eigene Reports zusammenstellen. Alle Nutzerdaten sind zentral hinterlegt, so dass jederzeit darauf zurückgegriffen werden kann. Die TRANSFAC-Datenbank zeichnet sich durch eine selbsterklärende Menüführung und ansprechende Bedienoberfläche aus. Alle Daten sind untereinander verlinkt, so dass zu einer bestimmten Fragestellung alle verfügbaren Informationen direkt sicht- und abrufbar sind.
Zur Auswertung der eigenen Daten stehen verschiedene Tools zur Verfügung
Mit dem MATCH-Tool können eigene DNA-Sequenzen oder ein ganzer Satz an Genen bzw. an miRNA-Daten auf mögliche Bindungsstellen für Transkriptionsfaktoren hin untersucht werden. Es sind aber auch tiefergehende Analysen möglich. So kann über das FMatch-Tool die Genexpression in verschiedenen Proben verglichen werden und Promotersequenzen, die in bestimmten Proben überrepräsentiert sind, können identifiziert werden. Die Zahl an diesen Bindungsstellen in verschiedenen Sequenzen gegenüber Vergleichsproben lässt Rückschlüsse auf die Genexpression und die Genregulation zu, womit übergeordnete Regulationsmuster erkannt werden können.
Über das COMPOSITE MODEL-Tool können Transkriptionsfaktoren gesucht werden, die gemeinsam die Genexpression, beispielsweise in einem bestimmten Gewebe, regulieren. Damit kann die Kontrolle der Genregulation in diesem Gewebe sehr genau analysiert und weitergehende Fragestellungen können angegangen werden.
Es existieren eine Vielzahl an verschiedenen DNA-Bindungssequenzen für die unterschiedlichen Transkriptionsfaktoren. Diese Transcription Factor Binding Sites (TFBS) können wiederum aufgrund ihres ähnlichen Nukleotidmusters zu sogenannten Matrizen zusammengefasst werden. In der TRANSFAC-Datenbank sind eine Vielzahl dieser Matrizen hinterlegt, geordnet nach Spezies, gegen die die eigenen Daten verglichen werden können. Es können auch eigene Matrizen auf der Grundlage der eigenen Daten erzeugt werden. Beides ist mit dem MATRIX-Tool möglich.
Für spezifische Promotor-Analysen oder Promoter-Modeling steht das ExPlain analysis system zur Verfügung. Dieses ist ein zusätzliches Tool, welches in der Standard-Version der TRANSFAC-Datenbank nicht enthalten ist.
Einen umfassenden Überblick kann man sich schließlich mit dem BKL-PATHFINDER-Tool verschaffen. Hier können sämtliche Daten zu Genen, Proteinen und Reaktionen importiert und miteinander in Verbindung gebracht werden. Dadurch werden Verknüpfungen sichtbar und regulatorische Netzwerke, Stoffwechselwege und deren Regulation auf genetischer Ebene können aufgespürt und dargestellt werden.
Verschiedene Reports liefern datenspezifische Hintergrundinformationen
TRANSFAC besteht aus einer Vielzahl an Reports, die eine detaillierte Darstellung zu Transkriptionsfaktoren, den sie codierenden Genen bzw. den von ihnen kontrollierten Genbereichen enthalten (Locus Report und Functional Region Report). Weitere enthalten ausführliche Informationen und Übersichten zu den Bindungsstellen der unterschiedlichen Transkriptionsfaktoren (Site Report), detaillierte Zusammenstellungen zu DNA-Fragmenten, die in ChIP-Experimenten als Bindungsstellen für Transkriptionsfaktoren identifiziert wurden (ChIP-Fragment Report), sowie die Zusammenstellung verschiedener Matrizen (Matrix-Report). Jeder Report ist gleich aufgebaut und strukturiert, so dass sich der Nutzer relativ einfach auf der Seite zurecht finden kann. In jedem Report sind neben der eigentlichen Beschreibung zahlreiche Querverlinkungen sowie weiterführende Literaturquellen enthalten.
Die TRANSFAC-Datenbank unterstützt eine effiziente und effektive Arbeitsweise
Forscher, die mit der TRANSFAC-Datenbank arbeiten, ersparen sich viele, zeitintensive Suchanfragen in diversen Gendatenbanken und Literaturrecherchen. Die eigenen Daten können sehr effizient untersucht werden und Ergebnisse sind in relativ kurzer Zeit verfügbar. Durch die umfassende Sammlung an Daten und Informationen, mit denen die eigenen Ergebnisse verglichen werden können, kann aus einer einzigen Probe sehr viel Information gewonnen werden. Damit kann – ganz im Sinne einer nachhaltigen Arbeitsweise – eine Menge an Strom und Energie, eingespart werden. Denn mit jeder Datenbankanfrage wird Strom verbraucht – was sich bei einer hohen Datenmenge sehr schnell zu einem beträchtlichen Verbrauch summieren kann. Jede unnötige Abfrage sollte daher im Sinne der Green-IT- vermieden werden – auch dann, wenn der Strom aus erneuerbaren Quellen stammt oder mit Gas im institutseigenen BHKW erzeugt wurde. Dies unterstützt schließlich auch die Anstrengungen im modernen Laborbetrieb: denn heute kann, im Gegensatz zu früheren Zeiten, durch eine gut durchdachte und geplante Labortechnik bereits viel an Ressourcen, wie Energie, Strom und Gas eingespart werden. Dieser Trend in der Planung sollte durch einen ressourceneffizienten Betrieb unterstützt und gefördert werden.