WEB SEMÂNTICA O futuro da Web se constrói em meio a páginas ricas em conteúdo que obedecem universalmente a padrões, bem diferente da Web que víamos antigamente, aquela em que a informação era toda desorganizada e difícil de entender, mas o que a Web Semântica tem haver com isso? A Web Semântica foi um projeto criado por Tim Berners-Lee, nada mais nada menos que o criador do HTML e da World Wide Web, onde o objetivo desse projeto é melhorar a Web através de padrões e ferramentas que tornem seu conteúdo claro e de fácil manutenção. As páginas construídas dentro da Web Semântica passam a poder ser lidas tanto por humanos ou por máquinas, e também tanto podem ser apresentadas graficamente, como podem ser lidas por leitores de tela, e também por dispositivos móveis, como celulares. A Web semântica é uma extensão da Web atual, que permitirá aos computadores e humanos trabalharem em cooperação. A Web semântica interliga significados de palavras e, neste âmbito, tem como finalidade conseguir atribuir um significado (sentido) aos conteúdos publicados na Internet de modo que seja perceptível tanto pelo humano como pelo computador. O objetivo principal da Web semântica não é, momentaneamente, treinar as máquinas para que se comportem como pessoas, mas sim desenvolver tecnologias e linguagens que tornem a informação legível para as máquinas. A finalidade passa pelo desenvolvimento de um modelo tecnológico que permita a partilha global de conhecimento assistido por máquinas (W3C 2001). A integração das linguagens ou tecnologias eXtensible Markup Language (XML), Resource Description Framework (RDF), arquiteturas de metadados, ontologias, agentes computacionais, entre outras, favorecerá o aparecimento de serviços Web que garantam a interoperabilidade e cooperação. Ultimamente tem-se associado Web Semântica a Web 3.0, como um próximo movimento da Internet depois da Web 2.0 que já inicia seu crescimento.
Nada melhor do que exemplos para entender melhor como funciona e o que existe em relação a web semântica:
Freebase: Uma base de dados aberta, onde as pessoas criam dados e conectam esses dados entre si, onde são classificados por temas e sessões. Tem como objetivo ser um grande repositório de conhecimento humano, seguindo o estilo da wikipedia.
Powerset: Adquirida recentemente pela Microsoft, é um engenho de busca de linguagem natural. Pode processar perguntas por exemplo, porém ainda está em estado inicial e funciona bem para inglês apenas pelo que pude perceber.
Twine: Aprende sobre voce e os seus interesses a partir do conteúdo que você cria e compartilha e faz um grafo desse conteúdo. Ainda está em beta fechado mas pode ser visto um screenshot aqui.
AdaptiveBlue: Um plug-in que oferece links de acordo com o contexto da página que se está navegando. Trazendo informações relevantes sobre livros, música, filmes, vinhos, receitas e ações por exemplo.
Hakia: Apontado com um dos mais promissores engenhos de busca em alternativa ao Google, faz a análise de sentenças na hora de fazer uma busca. Disponível em português também, trouxe resultados relevantes em algumas buscas que fiz.
Talis: Diferente dos outros exemplos da lista, Talis é uma plataforma para criação de aplicações semânticas na web. Os desenvolvedores podem criar, compartilhar e reutilizar informações nessa plataforma, que tem como objetivo facilitar o desenvolvimento das aplicações semânticas.
TrueKnowledge: Tenta responder as suas perguntas a partir de uma base de dados com conhecimentos e conexões. Funciona parecido com o Powerset e está em beta privado por enquanto. O vídeo mostrado na página principal é bastante explicativo.
TripIt: Organize suas viagens, você poderá criar suas viagens e receber informações do flickr e wikipedia. Você também pode coletar informações na web e adicionar as suas viagens utilizando um plug-in, além de poder colocar seu calendário de viagens no Google Calendar por exemplo. Ainda é possível procurar por hotéis, vôos e aluguel de carros.
ClearForest: Uma companhia que aposta na abordagem top-down. Possui um plug-in chamado Gnosis que permite identificar pessoas, países, tecnologias, companhias, organizações, produtos e dados geográficos no texto que você está visualizando, o texto é marcado com uma cor de acordo com a categoria que pertence.
Spock: Você pode buscar por pessoas e obter informações associadas a essas pessoas, pelo que notei funciona melhor para pessoas famosas por enquanto, também é possível buscar pelo email, porém é necessário ser cadastrado.
Conclusões Existem várias aplicações que estão sendo desenvolvidas, essas são apenas algumas delas. É uma área que irá ajudar bastante nessa fase da web que passa por um momento de grande criação de conteúdo, é necessário organizar tal conteúdo dar sentido e conexões. Apesar da visão do Google de organizar as informações do mundo inteiro, o engenho de busca do Google deixa a desejar no aspecto semântico como é mostrado no vídeo do TrueKnowledge. A Microsoft que anda querendo desbancar o Google no setor da internet aposta nessa brecha comprando Powerset recentemente. A tecnolgia ainda está em desenvolvimento e levará um certo tempo até que possa ser usada em larga escala. São grandes os esforços científicos e de orgãos para tentar criar padrões, alguns acham que a tecnologia nunca irá decolar pois precisa de um grande esforço no caso da abordagem bottom up, já outros apostam na idéia de web como plataforma para criar novas aplicações e serviços que se comunicam para gerar conhecimento.
O uso da web semântica é ter o foco na máquina, "Machine-understandable Information", esta é a definição da Web Semântica, segundo o "pai da Web", Tim Berners-Lee. A Web Semâtica começou em 2001. O XML é a ferramenta principal, onde o usuário pode descrever os dados de sua maneira. Alguns chegam a chamar de Web 3.0. Existe também os chamados Agentes que são softwares funcionando sem a necessidade de controle direto ou supervisão permanente para cumprir demandas estabelecidas por um usuário.
A Web semântica interliga significados de palavras e, neste âmbito, tem como finalidade conseguir atribuir um significado (sentido) aos conteúdos publicados na Internet de modo que seja perceptível tanto pelo humano como pelo computador
O termo Web 3.0 foi empregado pela primeira vez pelo jornalista John Markoff, num artigo do New York Times e logo incorporado e rejeitado com igual ardor pela comunidade virtual. A principal reação vem da blogosfera. Nos diários virtuais de especialistas detratores, a crítica mais comum é a de que Web 3.0 nada mais é do que a tentativa de incutir nos internautas num termo de fácil assimilação para definir algo que ainda nem existe. Aliás, críticas idênticas já se fazem à Web 2.0.
A Web 3.0 propõe-se a ser, num período de cinco a dez anos, a terceira geração da Internet. A primeira, Web 1.0, foi a implantação e popularização da rede em si; a Web 2.0 é a que o mundo vive hoje, centrada nos mecanismos de busca como Google e nos sites de colaboração do internauta, como Wikipedia, YouTube e os sites de relacionamento social, como o Orkut. A Web 3.0 pretende ser a organização e o uso de maneira mais inteligente de todo o conhecimento já disponível na Internet.
Esta inovação está focada mais nas estruturas dos sites e menos no usuário. Pesquisa-se a convergência de várias tecnologias que já existem e que serão usadas ao mesmo tempo, num grande salto de sinergia. Banda larga, acesso móvel à internet e a tecnologia da semântica, todos utilizados juntos, de maneira inteligente e atingindo a maturidade ao mesmo tempo.
Assim, se passaria da World Wide Web (rede mundial) para World Wide Database (base de dados mundial), ou seja, se passaria de um mar de documentos para um mar de dados. Quando isso começar a acontecer de forma mais intensa, o próximo passo, num prazo de cinco a dez anos, será o desenvolvimento de programas que entendam como fazer melhor uso desses dados.
Adicionada a capacidade da semântica a um site, ele será mais eficiente. Ao se pesquisar algo, se terá respostas mais precisas. O usuário poderá fazer perguntas ao seu programa e ele será capaz de ajudá-lo de forma mais eficente, entender mais sua necessidade. O conceito de ”semântica da rede”, proposto pelo inglês Tim Berners-Lee, tem entre seus gurus Daniel Gruhl, um Ph.D. em engenharia eletrônica do MIT, é especializado em "compreensão das máquinas", e o misterioso Nova Spivack, que não revela muito sobre si, nem o nome verdadeiro, e se autodefine como empresário da alta tecnologia.
Um mecanismo de busca como o Google permite que o usuário pesquise o conteúdo de cada página,: se indicar o nome de um ator ou de um filme, todos os dados sobre este ator ou este filme aparecerão na tela. Poderá ainda utilizar a "busca avançada" para restringir um pouco mais os resultados. Mas se este usuário não se lembrar do nome do ator ou do filme, dificilmente encontrará meios de localizá-los. A Web 3.0 organizará e agrupará essas páginas, por temas, assuntos e interesses previamente expressos pelo internauta.. Por exemplo: todos os filmes policiais, que tenham cenas de perseguição de carros, produzidos nos últimos cinco anos etc.
Algumas empresas do Vale do Silício, na Califórnia, Estados Unidos, desenvolvem trabalhos nesse sentido, destacando-se o Almaden IBM Research Center, a Metaweb e a Radar Networks (de Nova Spivack). No Brasil, na PUC-Rio estão desenvolvendo trabalhos pioneiros para a Web 3.0 com ênfase na língua portuguesa. Paralelamente, estão em curso inúmeros projetos acadêmicos. E circula na comunidade da informática que em futuro próximo surgirão novidades nesse campo na Yahoo e no Skype.
6 comentários:
galera sai procurando na net o q seria a web semântica; encontrei essa pagina onde achei a compreensão mais facilitada..se puderem dêem uma lida
http://www.pinceladasdaweb.com.br/blog/2006/05/17/o-que-e-a-web-semantica/
WEB SEMÂNTICA
O futuro da Web se constrói em meio a páginas ricas em conteúdo que obedecem universalmente a padrões, bem diferente da Web que víamos antigamente, aquela em que a informação era toda desorganizada e difícil de entender, mas o que a Web Semântica tem haver com isso?
A Web Semântica foi um projeto criado por Tim Berners-Lee, nada mais nada menos que o criador do HTML e da World Wide Web, onde o objetivo desse projeto é melhorar a Web através de padrões e ferramentas que tornem seu conteúdo claro e de fácil manutenção.
As páginas construídas dentro da Web Semântica passam a poder ser lidas tanto por humanos ou por máquinas, e também tanto podem ser apresentadas graficamente, como podem ser lidas por leitores de tela, e também por dispositivos móveis, como celulares.
A Web semântica é uma extensão da Web atual, que permitirá aos computadores e humanos trabalharem em cooperação. A Web semântica interliga significados de palavras e, neste âmbito, tem como finalidade conseguir atribuir um significado (sentido) aos conteúdos publicados na Internet de modo que seja perceptível tanto pelo humano como pelo computador.
O objetivo principal da Web semântica não é, momentaneamente, treinar as máquinas para que se comportem como pessoas, mas sim desenvolver tecnologias e linguagens que tornem a informação legível para as máquinas. A finalidade passa pelo desenvolvimento de um modelo tecnológico que permita a partilha global de conhecimento assistido por máquinas (W3C 2001). A integração das linguagens ou tecnologias eXtensible Markup Language (XML), Resource Description Framework (RDF), arquiteturas de metadados, ontologias, agentes computacionais, entre outras, favorecerá o aparecimento de serviços Web que garantam a interoperabilidade e cooperação.
Ultimamente tem-se associado Web Semântica a Web 3.0, como um próximo movimento da Internet depois da Web 2.0 que já inicia seu crescimento.
Fontes:
http://pt.wikipedia.org/wiki/Web_sem%C3%A2ntica
http://www.pinceladasdaweb.com.br/blog/2006/05/17/o-que-e-a-web-semantica/
http://www.comciencia.br/reportagens/internet/net08.htm
Nada melhor do que exemplos para entender melhor como funciona e o que existe em relação a web semântica:
Freebase: Uma base de dados aberta, onde as pessoas criam dados e conectam esses dados entre si, onde são classificados por temas e sessões. Tem como objetivo ser um grande repositório de conhecimento humano, seguindo o estilo da wikipedia.
Powerset: Adquirida recentemente pela Microsoft, é um engenho de busca de linguagem natural. Pode processar perguntas por exemplo, porém ainda está em estado inicial e funciona bem para inglês apenas pelo que pude perceber.
Twine: Aprende sobre voce e os seus interesses a partir do conteúdo que você cria e compartilha e faz um grafo desse conteúdo. Ainda está em beta fechado mas pode ser visto um screenshot aqui.
AdaptiveBlue: Um plug-in que oferece links de acordo com o contexto da página que se está navegando. Trazendo informações relevantes sobre livros, música, filmes, vinhos, receitas e ações por exemplo.
Hakia: Apontado com um dos mais promissores engenhos de busca em alternativa ao Google, faz a análise de sentenças na hora de fazer uma busca. Disponível em português também, trouxe resultados relevantes em algumas buscas que fiz.
Talis: Diferente dos outros exemplos da lista, Talis é uma plataforma para criação de aplicações semânticas na web. Os desenvolvedores podem criar, compartilhar e reutilizar informações nessa plataforma, que tem como objetivo facilitar o desenvolvimento das aplicações semânticas.
TrueKnowledge: Tenta responder as suas perguntas a partir de uma base de dados com conhecimentos e conexões. Funciona parecido com o Powerset e está em beta privado por enquanto. O vídeo mostrado na página principal é bastante explicativo.
TripIt: Organize suas viagens, você poderá criar suas viagens e receber informações do flickr e wikipedia. Você também pode coletar informações na web e adicionar as suas viagens utilizando um plug-in, além de poder colocar seu calendário de viagens no Google Calendar por exemplo. Ainda é possível procurar por hotéis, vôos e aluguel de carros.
ClearForest: Uma companhia que aposta na abordagem top-down. Possui um plug-in chamado Gnosis que permite identificar pessoas, países, tecnologias, companhias, organizações, produtos e dados geográficos no texto que você está visualizando, o texto é marcado com uma cor de acordo com a categoria que pertence.
Spock: Você pode buscar por pessoas e obter informações associadas a essas pessoas, pelo que notei funciona melhor para pessoas famosas por enquanto, também é possível buscar pelo email, porém é necessário ser cadastrado.
Conclusões
Existem várias aplicações que estão sendo desenvolvidas, essas são apenas algumas delas. É uma área que irá ajudar bastante nessa fase da web que passa por um momento de grande criação de conteúdo, é necessário organizar tal conteúdo dar sentido e conexões. Apesar da visão do Google de organizar as informações do mundo inteiro, o engenho de busca do Google deixa a desejar no aspecto semântico como é mostrado no vídeo do TrueKnowledge. A Microsoft que anda querendo desbancar o Google no setor da internet aposta nessa brecha comprando Powerset recentemente.
A tecnolgia ainda está em desenvolvimento e levará um certo tempo até que possa ser usada em larga escala. São grandes os esforços científicos e de orgãos para tentar criar padrões, alguns acham que a tecnologia nunca irá decolar pois precisa de um grande esforço no caso da abordagem bottom up, já outros apostam na idéia de web como plataforma para criar novas aplicações e serviços que se comunicam para gerar conhecimento.
Fonte: ReadWriteWeb
O uso da web semântica é ter o foco na máquina, "Machine-understandable Information", esta é a definição da Web Semântica, segundo o "pai da Web", Tim Berners-Lee. A Web Semâtica começou em 2001. O XML é a ferramenta principal, onde o usuário pode descrever os dados de sua maneira. Alguns chegam a chamar de Web 3.0. Existe também os chamados Agentes que são softwares funcionando sem a necessidade de controle direto ou supervisão permanente para cumprir demandas estabelecidas por um usuário.
Renato Bomfim
A Web semântica interliga significados de palavras e, neste âmbito, tem como finalidade conseguir atribuir um significado (sentido) aos conteúdos publicados na Internet de modo que seja perceptível tanto pelo humano como pelo computador
O termo Web 3.0 foi empregado pela primeira vez pelo jornalista John Markoff, num artigo do New York Times e logo incorporado e rejeitado com igual ardor pela comunidade virtual. A principal reação vem da blogosfera. Nos diários virtuais de especialistas detratores, a crítica mais comum é a de que Web 3.0 nada mais é do que a tentativa de incutir nos internautas num termo de fácil assimilação para definir algo que ainda nem existe. Aliás, críticas idênticas já se fazem à Web 2.0.
A Web 3.0 propõe-se a ser, num período de cinco a dez anos, a terceira geração da Internet. A primeira, Web 1.0, foi a implantação e popularização da rede em si; a Web 2.0 é a que o mundo vive hoje, centrada nos mecanismos de busca como Google e nos sites de colaboração do internauta, como Wikipedia, YouTube e os sites de relacionamento social, como o Orkut. A Web 3.0 pretende ser a organização e o uso de maneira mais inteligente de todo o conhecimento já disponível na Internet.
Esta inovação está focada mais nas estruturas dos sites e menos no usuário. Pesquisa-se a convergência de várias tecnologias que já existem e que serão usadas ao mesmo tempo, num grande salto de sinergia. Banda larga, acesso móvel à internet e a tecnologia da semântica, todos utilizados juntos, de maneira inteligente e atingindo a maturidade ao mesmo tempo.
Assim, se passaria da World Wide Web (rede mundial) para World Wide Database (base de dados mundial), ou seja, se passaria de um mar de documentos para um mar de dados. Quando isso começar a acontecer de forma mais intensa, o próximo passo, num prazo de cinco a dez anos, será o desenvolvimento de programas que entendam como fazer melhor uso desses dados.
Adicionada a capacidade da semântica a um site, ele será mais eficiente. Ao se pesquisar algo, se terá respostas mais precisas. O usuário poderá fazer perguntas ao seu programa e ele será capaz de ajudá-lo de forma mais eficente, entender mais sua necessidade. O conceito de ”semântica da rede”, proposto pelo inglês Tim Berners-Lee, tem entre seus gurus Daniel Gruhl, um Ph.D. em engenharia eletrônica do MIT, é especializado em "compreensão das máquinas", e o misterioso Nova Spivack, que não revela muito sobre si, nem o nome verdadeiro, e se autodefine como empresário da alta tecnologia.
Um mecanismo de busca como o Google permite que o usuário pesquise o conteúdo de cada página,: se indicar o nome de um ator ou de um filme, todos os dados sobre este ator ou este filme aparecerão na tela. Poderá ainda utilizar a "busca avançada" para restringir um pouco mais os resultados. Mas se este usuário não se lembrar do nome do ator ou do filme, dificilmente encontrará meios de localizá-los. A Web 3.0 organizará e agrupará essas páginas, por temas, assuntos e interesses previamente expressos pelo internauta.. Por exemplo: todos os filmes policiais, que tenham cenas de perseguição de carros, produzidos nos últimos cinco anos etc.
Algumas empresas do Vale do Silício, na Califórnia, Estados Unidos, desenvolvem trabalhos nesse sentido, destacando-se o Almaden IBM Research Center, a Metaweb e a Radar Networks (de Nova Spivack). No Brasil, na PUC-Rio estão desenvolvendo trabalhos pioneiros para a Web 3.0 com ênfase na língua portuguesa. Paralelamente, estão em curso inúmeros projetos acadêmicos. E circula na comunidade da informática que em futuro próximo surgirão novidades nesse campo na Yahoo e no Skype.
Postar um comentário