SlideShare ist ein Scribd-Unternehmen logo
1 von 24
Web Science 3. nodarbība 29.09.2011
Jaunumi
Video O’Reilly Strata conference Data Bootcamp (5 stundas video)http://shop.oreilly.com/product/0636920018506.do Meaningful Insights from Raw Metrics (Virtual worlds, …)http://shop.oreilly.com/product/0636920019176.do O’Reilly OSCon – data sessions
Kā gāja ar 500 tweetu savakāšanu
500 tweeti ,[object Object]
Kādi rezultāti?
Kādas problēmas?
Pārdomas?,[object Object]
Streaming API https://dev.twitter.com/docs/streaming-api
Uzdevums ,[object Object]
datuvākšanaipēcnorādītajiematslēgasvārdiem
datuvākšanaipēcizvēlētāmģeogrāfiskajāmkoordinātēm
savākt 1000 Twitter ziņas
+ analizēt un/vaivizualizēttās,[object Object],[object Object]
Python Izmantotspiemērosar Web Science saistītosresursos: “Mining the Social Web” “Natural Language Processing with NLTK” O’Reilly Strata conf – “Data Bootcamp” Viegliapgūstamavaloda Tīra, vieglilasāmasintakse Dive Into Python: http://diveintopython.org/toc/index.html
Python Plašsbibliotēkuatbalsts NLTK, SciPy, networkx, WebKit iPython Lietojumiapmācībā un darbā Viena no Google “oficiālajām” valodām MIT nesenpārgājauz Python progrmmēšanasapmācībaibakalaurukursāhttp://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-189-a-gentle-introduction-to-programming-using-python-january-iap-2011/
Valodasizvēle Python lietojumamirdažaspriekšrocības: mēsvarampalīdzētdarbāar Python tajāirrakstīti “Mining the Social Web” piemēri Varlietotvairākasvalodas / servisus vienu – datuvākšanai citu – datuapstrādeivaivizualizācijai Katrasgrupasziņā
Grupas? Projekti?
NLP prezentācija
Web Scienceun dabīgā valoda?
Datu veidi Nestrukturēti vai formāli vāji strukturēti dati HTML lapas (prezentācija vs. semantika) teksts, attēli, video u.c. Struktrēti dati RDB tīmekļa serviss RDF/SPARQL end-points DBpedia, Freebase, GeoNames, OpenCyc, ... Linked Data un LOD Community Sociālie tīkli Twitter struktūra Facebook sociālais grafs un Open Graph protokols ...
Datu apstrāde Priekšapstrāde Dabīgās valodas apstrāde Datu “bagātināšana” (metadati, linked data) Analīze, vizualizācija, ...
Priekšapstrāde Formāti, rakstzīmju kodējumi, valodas noteikšana Potenciāli derīgā satura (satura bloku) atfiltrēšana (web scraping kontekstā) Tvītu un komentāru normalizācija “Tokenizācija” jeb teksta sadalīšana vārdos (vārdlietojumos) Kas ir vārds? Identitāšu anonimizācija (MD5) ...
Uzdevums Kad zināma datu kopa jau ir savākta... Tokenizācija: “normālie” vārdi, skaitļi, citi (..), “liekie” (Sakārtots) biežumsaraksts: vārdformas un to lietojumu skaits Novērojumi, secinājumi?

Weitere ähnliche Inhalte

Mehr von Uldis Bojars

Library Linked Data in Latvia - #LIBER2014 poster
Library Linked Data in Latvia - #LIBER2014 posterLibrary Linked Data in Latvia - #LIBER2014 poster
Library Linked Data in Latvia - #LIBER2014 posterUldis Bojars
 
Semantiskais tīmeklis un Atvērtie dati
Semantiskais tīmeklis un Atvērtie datiSemantiskais tīmeklis un Atvērtie dati
Semantiskais tīmeklis un Atvērtie datiUldis Bojars
 
Linked Open Data / Atvērtie saistītie dati
Linked Open Data / Atvērtie saistītie datiLinked Open Data / Atvērtie saistītie dati
Linked Open Data / Atvērtie saistītie datiUldis Bojars
 
Linked Data from a Digital Object Management System
Linked Data from a Digital Object Management SystemLinked Data from a Digital Object Management System
Linked Data from a Digital Object Management SystemUldis Bojars
 
Web Science - 1. lekcija
Web Science - 1. lekcijaWeb Science - 1. lekcija
Web Science - 1. lekcijaUldis Bojars
 
Exploring the Networks in Open Public Data
Exploring the Networks in Open Public DataExploring the Networks in Open Public Data
Exploring the Networks in Open Public DataUldis Bojars
 
Envisioning Social Applications of Library Linked Data
Envisioning Social Applications of Library Linked DataEnvisioning Social Applications of Library Linked Data
Envisioning Social Applications of Library Linked DataUldis Bojars
 
Web Science 01.12.2011 - Linked Data
Web Science 01.12.2011 - Linked DataWeb Science 01.12.2011 - Linked Data
Web Science 01.12.2011 - Linked DataUldis Bojars
 
Web Science 15.09.2011
Web Science 15.09.2011Web Science 15.09.2011
Web Science 15.09.2011Uldis Bojars
 
Web Science seminārs - intro
Web Science seminārs - introWeb Science seminārs - intro
Web Science seminārs - introUldis Bojars
 
Weaving SIOC into the Web of Linked Data
Weaving SIOC into the Web of Linked DataWeaving SIOC into the Web of Linked Data
Weaving SIOC into the Web of Linked DataUldis Bojars
 
Data Portability with SIOC and FOAF
Data Portability with SIOC and FOAFData Portability with SIOC and FOAF
Data Portability with SIOC and FOAFUldis Bojars
 
FOAF for Social Network Portability
FOAF for Social Network PortabilityFOAF for Social Network Portability
FOAF for Social Network PortabilityUldis Bojars
 
SIOC: Semantic Web for Social Media Sites
SIOC: Semantic Web for Social Media SitesSIOC: Semantic Web for Social Media Sites
SIOC: Semantic Web for Social Media SitesUldis Bojars
 
XUL - Mozilla Application Framework
XUL - Mozilla Application FrameworkXUL - Mozilla Application Framework
XUL - Mozilla Application FrameworkUldis Bojars
 

Mehr von Uldis Bojars (15)

Library Linked Data in Latvia - #LIBER2014 poster
Library Linked Data in Latvia - #LIBER2014 posterLibrary Linked Data in Latvia - #LIBER2014 poster
Library Linked Data in Latvia - #LIBER2014 poster
 
Semantiskais tīmeklis un Atvērtie dati
Semantiskais tīmeklis un Atvērtie datiSemantiskais tīmeklis un Atvērtie dati
Semantiskais tīmeklis un Atvērtie dati
 
Linked Open Data / Atvērtie saistītie dati
Linked Open Data / Atvērtie saistītie datiLinked Open Data / Atvērtie saistītie dati
Linked Open Data / Atvērtie saistītie dati
 
Linked Data from a Digital Object Management System
Linked Data from a Digital Object Management SystemLinked Data from a Digital Object Management System
Linked Data from a Digital Object Management System
 
Web Science - 1. lekcija
Web Science - 1. lekcijaWeb Science - 1. lekcija
Web Science - 1. lekcija
 
Exploring the Networks in Open Public Data
Exploring the Networks in Open Public DataExploring the Networks in Open Public Data
Exploring the Networks in Open Public Data
 
Envisioning Social Applications of Library Linked Data
Envisioning Social Applications of Library Linked DataEnvisioning Social Applications of Library Linked Data
Envisioning Social Applications of Library Linked Data
 
Web Science 01.12.2011 - Linked Data
Web Science 01.12.2011 - Linked DataWeb Science 01.12.2011 - Linked Data
Web Science 01.12.2011 - Linked Data
 
Web Science 15.09.2011
Web Science 15.09.2011Web Science 15.09.2011
Web Science 15.09.2011
 
Web Science seminārs - intro
Web Science seminārs - introWeb Science seminārs - intro
Web Science seminārs - intro
 
Weaving SIOC into the Web of Linked Data
Weaving SIOC into the Web of Linked DataWeaving SIOC into the Web of Linked Data
Weaving SIOC into the Web of Linked Data
 
Data Portability with SIOC and FOAF
Data Portability with SIOC and FOAFData Portability with SIOC and FOAF
Data Portability with SIOC and FOAF
 
FOAF for Social Network Portability
FOAF for Social Network PortabilityFOAF for Social Network Portability
FOAF for Social Network Portability
 
SIOC: Semantic Web for Social Media Sites
SIOC: Semantic Web for Social Media SitesSIOC: Semantic Web for Social Media Sites
SIOC: Semantic Web for Social Media Sites
 
XUL - Mozilla Application Framework
XUL - Mozilla Application FrameworkXUL - Mozilla Application Framework
XUL - Mozilla Application Framework
 

Web Science 29.09.2011

Hinweis der Redaktion

  1. Šie 2 slaidinebijaseminārā, bet tikapievienotivēlākkādatuvizualizācijasservisapiemērs.
  2. Šie 2 slaidinebijaseminārā, bet tikapievienotivēlākkādatuvizualizācijasservisapiemērs.
  3. C/C++, Java, Python and Javascriptvailaistprogrammasuz Google App Engine
  4. NLP prezentācijassākums
  5. NLP prezentācijasbeigas