Friday, July 8, 2016

Alendronsäure 53






+

Datendump Die RDF-Daten serialisiert die N-Triples-Format, codiert als UTF-8-Text und komprimiert mit gzip. Wenn Sie Ihren eigenen Code schreiben zu analysieren die RDF-Dumps seine oft effizienter direkt von GZIP-Datei zu lesen, anstatt die Daten zuerst zu extrahieren und dann die Verarbeitung der unkomprimierten Daten. Hinweis: In Freebase, Objekte MIDs, die / aussehen m / 012rkqx. In RDF werden diese MIDs m.012rkqx. Ebenso Freebase Schema wie / common / Thema als common. topic geschrieben. Das Thema ist die ID eines Objekts Freebase. Es kann für die Themen und CVTs oder einem Menschen lesbaren ID (ex. Common. topic) für Schema ein Freebase MID (ex. M.012rkqx) sein. Das Prädikat ist immer eine menschenlesbare ID für eine Eigenschaft oder Freebase eine Eigenschaft von einem Standard-RDF Vokabular wie RDFS. Freebase Fremdschlüssel Namensräume sind auch als Prädikate verwendet, um es einfacher Schlüssel von Namensraum zu suchen. Das Objektfeld ein Freebase MID für ein Objekt oder eine menschenlesbare ID für Schema von Freebase oder anderen RDF-Vokabulare enthalten. Es kann auch Literalwerte wie Strings, Boolesche Werte und numerische Werte enthalten. Topic Beschreibungen enthalten oft neue Zeilen. Um jede dreifach passen auf eine Linie zu machen, haben wir maskierten Newlines mit. Freebase Deleted Triples Wir bieten auch einen Dump verdreifacht, die von Freebase im Laufe der Zeit gelöscht wurden. Dies ist eine einmalige Dump bis März 2013 In Zukunft könnten wir regelmäßige Aktualisierungen der kürzlich gelöschten Tripel Bereitstellung betrachten, aber im Moment haben wir keine bestimmte Frist für so tun, und bieten nur diese einmalige Müllhalde. Der Dump wird als tar. gz-Datei (2,1 GB komprimiert, 7.7Gb unkomprimiert) verteilt. Es enthält 63.036.271 gelöscht Tripel in 20 Dateien (es zu den einzelnen Dateien keine besondere Bedeutung ist, ist es einfach leichter ist, mehrere kleinere Dateien als eine große Datei zu manipulieren). Dank Chun Wie Tan und John Giannandrea diese Datenfreigabe möglich zu machen. Das Datenformat ist im Wesentlichen mit einem CSV wichtige Einschränkung. Das Objektfeld beliebige Zeichen enthalten, einschließlich Kommas (sowie andere zumutbare Begrenzer könnte man denken). Jedoch sind alle anderen Felder sind garantiert keine Kommas enthalten, so können die Daten immer noch eindeutig analysiert werden. Die Spalten im Datensatz sind definiert als: creation_timestamp (Unix Epoche Zeit in Millisekunden) Schöpfer deletion_timestamp (Unix Epoche Zeit in Millisekunden) Deletor Gegenstand (MID) Prädikat (MID) Objekt (MID / Wörtliche) language_code CSV Freebase / Wikidata Mappings Die Daten wurden auf der Grundlage des Wikidata-Dump vom 28. Oktober erstellt, 2013, und enthält nur die Verbindungen, die mindestens zwei gemeinsame Wikipedia-Verbindungen und nicht eine einzige uneins Wikipedia-Link-haben. Darüber hinaus werden die Linien durch die Anzahl der gemeinsamen Wikipedia-Verbindungen sortiert (obwohl in Turtle dies ist nicht wirklich wichtig). Die RDF-Daten serialisiert die N-Triples-Format, codiert als UTF-8-Text und komprimiert mit gzip. Lizenz Freebase Daten Dumps sind für jeden Zweck mit regelmäßigen Updates von Google kostenlos zur Verfügung gestellt. Sie sind verteilt, wie Freebase selbst, unter der Creative Commons Attribution (auch bekannt als CC-BY) und die Nutzung ist auf die Nutzungsbedingungen unterliegen. Die Freebase / Wikidata ID-Mappings werden unter CC0 zur Verfügung gestellt und können ohne Einschränkungen verwendet werden. Anführung Wenn Sie diese Daten in einer Publikation Dumps zitieren möchten, können Sie verwenden: Sofern nicht anders angegeben, ist der Inhalt dieser Seite unter der Creative Commons Attribution 3.0 License. und Code-Beispiele sind unter der Apache-2.0-Lizenz. Einzelheiten unserer Website-Richtlinien sehen. Обновлено Май 2, 2016


francelemoule.blogspot.com


No comments:

Post a Comment