BIOML & Friends

Download Report

Transcript BIOML & Friends

BIOML & Friends
George Gentsch, Lukas Stingelin
BIOML & Friends

Übersicht








5. Juni 2002
Allgemeine Einführung in BIOML
Biologischer Kontext
Implementation biologischer Sachverhalte
Struktur und Elemente von BIOML
Einführungbeispiele
Beispiele aus einer „annotated“ Datenbank
Spezieller BIOML Browser und Editor
Evtl. „Friends“ von BIOML
Seminar XML-Technologien/BIOML
& Friends
2
BIOML- Biopolymer Markup Language


Kurzbeschreibung:
BIOML erlaubt alle experimentellen Informationen über
eine molekulare Einheit bestehend aus Biopolymeren wie
zum Beispiel Proteine und Gene zu spezifizieren und
darzustellen.
Working Draft Proposal (kein W3C Working Draft):
 10.01.1999 (erste Version)
 von
5. Juni 2002
Seminar XML-Technologien/BIOML
& Friends
3
BIOML - Was sind die Ziele?

BIOML soll...



5. Juni 2002
ein erweiterbares „Framework“ für die Darstellung von
Biopolymeren wie zum Beispiel Proteine und Gene
liefern.
ein brauchbares Werkzeug für Biologen und andere
Naturwissenschaftler liefern, um Informationen zu
biopolymeren Sequenzen über das World Wide Web
oder ein Intranet auszutauschen.
die entsprechende Darstellung vereinheitlichen, also
einen (firmeninternen) Standard liefern.
Seminar XML-Technologien/BIOML
& Friends
4
BIOML - Entwicklungskriterien






BIOML Dokument soll eine zuverlässige Repräsentation
des Gen-Protein-Konzepts sein.
Alle bekannten experimentellen Daten über dieses Objekt
sollen logisch, zu einem biologisch bedeutungsvollen und
aussagekräftigen Gebilde zusammengefügt werden.
Das Dokument soll für den Forscher übersichtlich sein.
Information soll gebündelt und hierarchisch in eine BaumBlatt-Struktur eingepasst werden.
Dokument soll leicht erweiterbar, transferierbar und
implementierbar sein.
Es soll Konversionen von anderen Daten zu BIOML und
vice versa unterstützen.
5. Juni 2002
Seminar XML-Technologien/BIOML
& Friends
5
BIOML – „Inhaltsverzeichnis“

Welche Typen von Informationen müssen mit der
biopolymeren Sequenz im BIOML Dokument abgelegt sein,
damit die Information nützlich (für die biologische
Forschung) ist?
 Strukturinformation:
 Crosslinks
 Zusammensetzung
 Notizen zu Modifikationen und Aberrationen
 Assoziierte Information (Funktion, Pathologie usw.)
 Allgemeine Information (Autor, Datum etc.)
 Literaturreferenzen (u.a. Webadressen)
 Vergleich mit anderen Daten aus Datenbanken
 „Key“ Attribute (für Datenbanken)
5. Juni 2002
Seminar XML-Technologien/BIOML
& Friends
6
BIOML – Biologischer Kontext



Proteine
Vom Gen zum Protein
Tags, Visualisierung im Browser,
DTD
5. Juni 2002
Seminar XML-Technologien/BIOML
& Friends
7
Proteine
5. Juni 2002
Seminar XML-Technologien/BIOML
& Friends
8
Proteine




Kontrolle der Stoffwechselvorgänge
Zellmaschinerie
Strukturelemente
Linearer Aufbau mit Querverbindungen
5. Juni 2002
Seminar XML-Technologien/BIOML
& Friends
9
Vom Gen zum Protein


Transkription (Compile)
Translation (Run)
5. Juni 2002
Seminar XML-Technologien/BIOML
& Friends
10
Transkription


4 verschiedene Zeichen/Basen (ACTG) auf DNA
Proteine aus 20 verschiedenen Aminosäuren
aufgebaut
agcagccctccaggacaggctgcatca
cct cca gga cag gct gca tca


Stop
Codons 20 Aminosäuren Start
Abfolge der Codons = Abfolge der Aminosäuren
5. Juni 2002
Seminar XML-Technologien/BIOML
& Friends
11
Translation
5. Juni 2002
Seminar XML-Technologien/BIOML
& Friends
12
Translation
5. Juni 2002
Seminar XML-Technologien/BIOML
& Friends
13
Translation




Aneinanderreihung der
Aminosäuren
3D Struktur
Proprotein - Protein
Domänen, Strukturen
5. Juni 2002
Seminar XML-Technologien/BIOML
& Friends
14
Tags
<dna>
<promotor>
<gene>
<exon>
<intron>
<ddomain>
<da>
<dmod>
<dvariant>
5. Juni 2002
<dstart>
<dstop>
<rna>
<rdomain>
<ra>
<rmod>
<rvariant>
<rstart>
<rstop>
<protein>
<subunit>
<homolog>
<peptide>
<domain>
<aa>
<amod>
<alink>
<avariant>
Seminar XML-Technologien/BIOML
& Friends
15
Erweiterbarkeit


domain type (Protein)
aa type (Aminosäure)
5. Juni 2002
Seminar XML-Technologien/BIOML
& Friends
16
BIOML – Allgemeine Elemente (1)



Elemente zum allgemeinen Zweck
 meistens Blätter in der Baumstruktur
 z.B. <name>, <note>, <comment>, <copyright> usw.
Organismus definierende Elemente
 umschliessen Tags der biopolymeren Sequenzen
 z.B <organism>, <species>, <common_name> usw.
Ortsdefinierende Elemente
 z.B <tissue>, <cell>, <organelle> usw.
5. Juni 2002
Seminar XML-Technologien/BIOML
& Friends
17
BIOML – Allgemeine Elemente (2)

Literaturreferenzen

Tag <reference>

Blätter von <reference>: <author>, <title>, <journal>,
<pages> usw. Sie haben nur eine Bedeutung, wenn sie von
<reference>...</reference> umschlossen sind.

5. Juni 2002
...
<reference>
<author>Arber W.</author>
<title>restriction enzymes</title>
<journal>Nature</journal>
<pages>13</pages>
...
</reference> ...
Seminar XML-Technologien/BIOML
& Friends
18
BIOML – Allgemeine Elemente (3)

Datenbankreferenzen
 Tag <db_entry/> (immer leeres Element)
 Attribute: format, query, entry
 Beispiel:


5. Juni 2002
...
<reference>
<db_entry format="EMBL“ entry="L03655"/>
</reference> ...
...
<reference>
<db_entry format="GENBANK"
query="http://www2.ncbi.nlm.nih.gov/irx/cgi-bin/
birx_doc?genbank+444001"/>
</reference> ...
Seminar XML-Technologien/BIOML
& Friends
19
BIOML – Allgemeine Elemente (4)

URL-basierte Resourcen
 Element <file/> mit Attribute: format, query
 Element <query/> mit Attribute: format, query (CGI)
 Beide Elemente sind immer leer.

5. Juni 2002
...
<file URL="http://www.proteome.com/YPD/STE20.html"
format="HTML"/>
...
Seminar XML-Technologien/BIOML
& Friends
20
BIOML – Globale Attribute & Entitäten


Einige Attribute können in alle Elemente implementiert
werden:
 label
 Bezeichner für ein bestimmtes Element (Browser
braucht ihn als Platzhalter)
 state
 „hide“, „open“ oder „close“. Information für Browser,
wie das entsprechende Element dargestellt werden
soll.
 id
 Identifikationsnummer für Katalogisierungszweck
Entitäten - global zur Verfügung stehende Mnemonics:
 Å: &angstrom; usw.
5. Juni 2002
Seminar XML-Technologien/BIOML
& Friends
21
„Friends“ von BIOML
BSML
ChemML
SBML
MoDL
StarDOM
PROXIML
5. Juni 2002
CellML
MAML
GEML
GAME
GeneXML
Seminar XML-Technologien/BIOML
& Friends
MSAML
MAGE-ML
22
„Friends“ von BIOML
•MoDL:
•SBML:
•CellML:
•StarDOM:
•GeneXML:
•MAGE-ML:
•GAME:
•BSML:
•MSAML:
•PROXIML:
•GEML:
•MAML:
•ChemML:
5. Juni 2002
Molecular Dynamics [Markup] Language
Systems Biology Markup Language
Cell Markup Language
Transforming Scientific Data into XML
GeneX Gene Expression Markup Language
MicroArray and Gene Expression Markup Language
Genome Annotation Markup Elements
Bioinformatic Sequence Markup Language
XML for Multiple Sequence Alignments
Protein Extensible Markup Language
Gene Expression Markup Language
Microarray Markup Language
Chemical Markup Language
Seminar XML-Technologien/BIOML
& Friends
23
BSML – Bioinformatic Sequence
Markup Language




~ BIOML
 Standardisierung
Graphische Darstellung von Sequenzen und spezielle
Ausprägungen
Zugriff auf fremde Ressourcen
Durchmusterung von Genabschnitten mit Hilfe des BSMLBrowsers
5. Juni 2002
Seminar XML-Technologien/BIOML
& Friends
24
CellML – Cell Markup Language






Speicherung und Austausch von computerbasierten
biologischen Modellen.
Unterstützung verschiedener Modell bildenden
Programme
Möglichkeit der Wiederverwendung von Komponenten
eines Modells in anderen Modellen > Beschleunigung der
Modellbildung
Information zur Modellstruktur, wie die einzelnen
Komponenten untereinander organisiert sind.
Information zur Mathematik (Gleichungen für biologische
Prozesse) > MathML implementiert
Zusätzliche Daten für Suche von spezischen Modellen in
Datenbanken
5. Juni 2002
Seminar XML-Technologien/BIOML
& Friends
25
BIOML & Friends - Links

BIOML







Homepage http://www.bioml.com/BIOML/index.html
WDP http://www.bioml.com/BIOML/b_toc.htm
DTD http://www.bioml.com/BIOML/bioml.dtd
BioBrowser v1.3
http://www.proteometrics.com/gsc_BioML.html#browser
Übersicht http://xml.coverpages.org/bioml.html
XML in Bioinformatik http://bio.perls.org/Projects/XML/
Friends


5. Juni 2002
Übersicht von OASIS http://xml.coverpages.org/
<kürzel>.html
Praktisch jede Auszeichnungssprache hat ihre Homepage.
Z.B. http://www.bsml.org, http://www.cellml.org.
Seminar XML-Technologien/BIOML
& Friends
26