Web Science. O Que é Web Science? A World Wide Web (de agora em diante simplesmente chamada a Web)...

Preview:

Citation preview

Web Science

O Que é Web Science?A World Wide Web (de agora em diante simplesmente

chamada a Web) vem tendo um impacto cada vez maior na pesquisa científica, no desenvolvimento tecnológico e na sociedade como um todo. As formas pelas quais nos comunicamos, colaboramos e aprendemos estão mudando radicalmente graças à Web. Surpreendentemente, ela tem sido pouco pesquisada como um objeto de estudo per se. Isto motivou o aparecimento, em 2006, de uma nova área de pesquisa – a chamada Web Science. Neste novo domínio, a própria Web é o objeto a ser estudado – deixa, assim, de ser considerada como uma mera tecnologia baseada em computadores, e que serve de base para comunicação e interação em nível mundial.

• “É preciso que tudo mude para que tudo se mantenha”

– Giuseppe Tomasi di Lampedusa (1896-1957)

Eng. Software X Web Science

Engenharia de Software Web Science

Princípios Algoritmos, Complexidade & Modelagem

Requisitos & Qualidade Privacidade, Segurança, Propriedade Intelectual, Internacionalização, Resiliência, Acessabilidade & Inclusão Digital

Projeto & Arquitetura Redes Sociais, Web Móvel, Computação Ubíqua, Web Services, Arquiteturas para Governo Eletrônico, Sistemas Multi Agentes, Sistemas Colaborativos & Inteligência Ambiente

Processos & Gerência Web Semântica, Deep Web, Search Engines & Web Crawlers, Dados Multiimídia, Integração & Interoperabilidade, Descoberta de Conhecimento

Construção, Métodos & Ferramentas Infraestrutura, Padrões, Linguagens, Protocolos, Cloud

Evolução, Manutenção & Teste Futuras Arquiteturas para a Internet

Software• Let us consider the inherent properties of this irreducible

essence of modern software systems: complexity, conformity, changeability, and invisibility.

--- Fred Brooks No Silver Bullet Essence and Accidents in Software Engineering

• As Brooks suggests, "The complexity of software is an essential property, not an accidental one." We observe that this inherent complexity derives from four elements: the complexity of the problem domain, the difficulty of managing the development process, the flexibility possible through software, and the problems of characterizing the behavior of discrete systems.

--- Grady Booch

7

Definition: Software Engineering

• The application of engineering to software• Field of computer science dealing with

software systems– large and complex– built by teams– exist in many versions– last many years– undergo changes

Fundamentals of Sofware Engineering – Ghezzi et al.

8

Definitions

• Application of a systematic, disciplined, quantifiable approach to the development, operation, and maintenance of software (IEEE 1990)

• Multi-person construction of multi-version software (Parnas 1978)

Fundamentals of Sofware Engineering – Ghezzi et al.

Ch.1 9

Role of SE in system design

• SE part of larger projects• Embedded

– Software requirements to be balanced against others

• e.g., telephone switching systems– certain requirements can only be met by hw, sw, and special

devices

Fundamentals of Sofware Engineering – Ghezzi et al.

10

History

• The field of software engineering was born in 1968 in response to chronic failures of large software projects to meet schedule and budget constraints – Recognition of "the software crisis"

• Term became popular after NATO Conference in Garmisch Partenkirchen (Germany), 1968

Fundamentals of Sofware Engineering – Ghezzi et al.

11

Role of the Software Engineer

• Programming skill not enough• Software engineering involves "programming-in-the

–large"– understand requirements and write specifications

• derive models and reason about them– master software – operate at various abstraction levels– member of a team

• communication skills• management skills

Fundamentals of Sofware Engineering – Ghezzi et al.

Our students are digital natives . . .

• Consumer experience drives expectations. – Desktop Mobile computing– Web sites Web experiences– Games Cast member/participant/group play– Static web content Real-time interaction & collaboration– Telephones Integrated mobile info, social, and recreational

devices– Email Instant video, voice, text messaging

• Consumer product shows may be the best indicator of future IT trends.

Requirements

• Information online, not “in line”• Information on-demand, free of place or time• Blended classroom and online experience• More team collaboration • More content from multiple sources• Interactive content from voice, video and data• Ability to contribute, as well as consume,

content/knowledge

Web 2.0

• Advanced Internet technology and applications including blogs, wikis, RSS, social bookmarking, etc.

• Greater collaboration among Internet users, content providers, and enterprises

• User input into the nature and scope of Web content, including real-time control over it

• Ability to “mash up” information from different sources to create the desired context for the information

• Key words: dynamic, interactive, collaborative• Light and dark side – YouTube and blogs as weapons.

IT Infrastructure• Networks will increase 500% in capacity in the next five

years.• Half of all computers will be laptops.• 60% of all colleges and universities have a campus wide

wireless plans.• Computers are increasing in the number of processors

from 2 to 4 to 8 by 2008.• Research networks will go from 622 megabits to 80

gigabits.• On-demand, high-definition video will consume a large

part of network capacity.

World-Wide Emerging Technology Trends

• Improved speech recognition• Fuel cells and improved battery life• More GPS-enabled, location-aware services• Moore’s Law (increasing chip density)• More network bandwidth( 100 terabyte with a single fiber)

60% broadband in US• More computing power• More storage

World-Wide Emerging Technology Trends

• Search engines will continue to increase access to books, web sites, recordings, movies, learning objects, lectures, the desk top and increased advertising revenue.

• Search is moving from search to navigation• Google now makes more in advertising revenue than ABC,

CBS and NBC combined• Instant Messaging will surpass email in volume of

communication in 5 years

Social Trends: Information Environmentalism

• A movement that seeks to reduce information overload and its effects on people’s lives.

– Privacy is a primary concern.

Evolving Science

• Thousand years ago: science was empirical

describing natural phenomena• Last few hundred years:

theoretical branch using models, generalizations

• Last few decades: a computational branch

simulating complex phenomena• Today:

data exploration synthesizing theory, experiment and

computation with advanced data management and statistics new algorithms!

2

22.

3

4

a

cG

a

a

2

22.

3

4

a

cG

a

a

Living in an Exponential World

• Scientific data doubles every year– caused by successive generations

of inexpensive sensors + exponentially faster computing

• Changes the nature of scientific computing• Cuts across disciplines (eScience)• It becomes increasingly harder to extract knowledge• 20% of the world’s servers go into huge data centers

by the “Big 5”– Google, Microsoft, Yahoo, Amazon, eBay

• So it is not only the scientific data!

Collecting Data

• Very extended distribution of data sets:data on all scales!

• Most datasets are small, and manually maintained (Excel spreadsheets)

• Total amount of data dominated by the other end(large multi-TB archive facilities)

• Most bytes today are collected via electronic sensors

Modelagem Conceitual

• Modelo: abstração da realidade, enfatizando características específicas.– representar uma visão do ambiente – representar as partes do todo– permitir a abordagem gradual da complexidade

(do mais abstrato para o mais detalhado)– úteis na organização das informações

Modelagem Conceitual

• Em geral, um único modelo não é suficiente para representar todas as características de em sistema

Exemplo Mapa - endereço

Exemplo Distâncias – Escala

Exemplo Foto

Modelagem Científica• Business process modelling • Cartography • Climate modelling • Data modelling • Ecological modelling • Economical modelling • Environmental modelling • Futures studies • Geologic modelling • Graphical modelling • Hydrography • Hydrological modelling • Hydrogeological modelling • Mathematical modelling • Medical modelling

• Modelling in Epidemiology • Molecular modelling • Morphological Modelling • Ocean modelling • Policy modelling • Simulation • Software modelling • Statistical modelling • Stochastical modelling • System dynamics • Thought experiment • Traffic and Transport modelling

Modelos QuantitativosServem para: Medir o Mundo• Precisão (3m, 76mm, 3.896m3, 12V, 30 minutos)• Estatísticos• Permitem análise automatizada

Exemplos:Voltagem de entrada, tamanho do fêmur do bebê, tempo de cozimento, vida útil do componente)

Ref: Rector et al

Modelos QualitativosServem para: Descrever o Mundo:• Pouca precisão• Ambíguos• Análise automatizada nos primórdios

ExemplosQuais são os legumes saudáveis?, Melhores filmes

do ano, Quais ruas tem menos trânsito?

Ref: Rector et al

Ferramentas úteis

• Abstração • Formalismo• Decomposição

Abstração X Formalismo

Abstração

• Ferramenta mais utilizada na racionalização de software

• Porque? – Ignorar detalhes incovenientes– Possibilita o mesmo tratamento a entidades

diferentes– Simplifica vários tipos de análise

Fonte: S. Easterbrook - UofT

Abstração

• Em programação– Abstração é o processo de nomear objetos

compostos e lidar com eles como se fossem entidades únicas

• Não resolve problemas– Mas simplifica!!!

Qualidade x Formalismo• Formalismo. Mininizar

– ambigüidade– inconsistência– omissão

Qualidade x Formalismo

• Interpretação única e bem definida da especificação (tanto por parte dos implementadores como por parte dos clientes).

• O rigor e o formalismo na especificação são recursos que visam maximizar essas qualidades.

Qualidade x FormalismoProblema:• Formalismos são difíceis de entender !!

Qualidade x Formalismo

• Saídas possíveis:– uso de especificação semiformal durante o

desenvolvimento (grau de formalismo definido em função do problema).

Qualidade x Formalismo

• Saídas possíveis:– uso de especificação formal apenas para

representar os requisitos do sistema e como guia para escrever o projeto, implementação e testes

Dividir e Conquistar• Tempos antigos “divide et impera”DIJKSTRA ((programming considered a human activity)

• Especifica as partes individualmente

http://www.cs.utexas.edu/users/UTCS/notices/dijkstra/ewdobit.html )

Dividir e Conquistar

• Satisfeito? O problema está resolvido?• Constrói as partes individualmente

se uma das partes ainda é complexa: subdividir

DecomposiçãoDecompor o problema até:

– Cada subproblema esteja no mesmo nível de detalhe

– Cada subproblema possa ser resolvido de modo independente

– As soluções de cada subproblema possam ser combinadas de modo a resolver o problema original

Decomposição

• Vantagens:– Pessoas diferentes podem trabalhar nos

subproblemas– Paralelização pode ser possível– Manutenção é mais fácil

Decomposição

• Desvantagens– As soluções dos subproblemas podem não

combinar de modo a resolver o problema original– Problemas de difícil compreensão são difíceis de

decompor– A estrutura do mundo real NÃO é hierárquica

[Jackson]

Decomposição Funcional

função 1 função 4

função 2

função 3

Entrada Saída

conexão

conexão

conexão

conexão

Fonte: Fernando Vanini - Unicamp

Exemplo: Taxonomia

• O termo taxonomia vem do grego “taxis”, que significa “arrumação”, e “nomos”, que significa “lei”.

• Definição: “vocabulário controlado e dinâmico de descritores relacionados com semântica e genericamente, que cobre de forma extensiva um ramo de conhecimento”

Dicionário Aurélio

Exemplo

Exemplo

Ser vivoEspécie

humanosIdade

Sexo

homens mulheres

crianças

X é uma subcategoria de y

Taxonomia dos seres vivos

adultos

Exemplo de Taxonomia

Exemplo de Taxonomia

Music Instrument Classification - 1914

Erich Moritz von Hornbostel & Curt Sachs

Taxonomia “Tortas”

Artes e EntretenimentoMúsica, Televisão, Rádios

Ciência e Meio AmbienteEngenharia, Física, AgropecuáriaMapas e VistasCâmeras Online

EconomiaInformática, Compras

Notícias Revistas, Televisão, Rádio

EsportesFutebol, Aquáticos, Artes Marciais,

SaúdeClínicas, Hospitais

Sociedade e CulturaReligião., Espiritualidade, TransportesAéreas, Rodoviárias, Viagens e TurismoMinas Gerais, Hospedagem,

Taxonomias Tortas

Mais Exemplos

• Outras taxonomias– Yahoo! categorias

• Catálogos de compras on-line – Submarino– LojasAmericanas.com– Amazon.com

• Dublin Core (Metadados)

Fonte: Julio Cesar Sampaio do Prado Leite

Construção de Taxonomias - Processo

Fonte: Julio Cesar Sampaio do Prado Leite

Taxonomia de TIC

11/04/23 (c) Dept. Informática - PUC-Rio 55

Motivação

Modelo β

Modelo ϕSearch Engine

Modelo Θ

11/04/23 (c) Dept. Informática - PUC-Rio 56

Motivação

• Algumas limitações dos Web search engines– cobertura limitada

• capturam apenas os dadosexportados pelos Web servers

– consulta limitada• pesquisa por palavras-chave

sobre texto

Iceberg Photo

Judith Currelly, Diane Farris Gallery

Modelagem da Web

• The science of networks is experiencing a boom. But despite the necessary multidisciplinary approach to tackle the theory of complexity, scientists remain largely compartmentalized in their separate disciplines.

Linked*• Stanley Milgram

– any two people are connected to each other through a mere 'six degrees’

• spread of computer viruses via the Internet, • AIDS epidemic through sexual contacts• 1997 currency-exchange crisis in Thailand• rich-get-richer phenomenon• Hubs (very well-connected nodes)

• affect properties of the network, such as susceptibility to computer-virus epidemics

• Social networks – small world – Duncal Watts

* Linked - Albert-László Barabási

Referências

• John F. Sowa, Knowledge Representation: Logical, Philosophical, and Computational Foundations, Brooks Cole Publishing Co., Pacific Grove, CA, ©2000.; ISBN 0-534-94965-7

• http://developer.yahoo.com/searchmonkey/

Recommended