86
INFORMÁTICA REVISÃO - AULA 02 Prof. Márcio Hunecke POLÍCIA FEDERAL

INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

Embed Size (px)

Citation preview

Page 1: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br

INFORMÁTICA

REVISÃO - AULA 02

Prof. Márcio Hunecke

POLÍCIA FEDERAL

Page 2: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento
Page 3: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br

Aula XX

3

Informática

SISTEMAS DE INFORMAÇÃO

Sistema pode ser definido como um conjunto de elementos/componentes que mantêm relações entre si. Os componentes e as relações formam as características específicas do sistema. Para o conjunto de relações entre componentes se associa uma ação/dinâmica e resultados.

Exemplos de sistemas: solar, energético, transporte, econômico, comunicação, molecular, entre outros.

Conceitos e componentes de Sistemas de Informação (SI)

Sistemas de Informação é a expressão utilizada para descrever um Sistema seja ele automatizado (que pode ser denominado como Sistema Informacional Computadorizado), seja manual, que abrange pessoas, máquinas e/ou métodos organizados para coletar, processar, transmitir e disseminar dados que representam informação para o usuário e/ou cliente.

Informações são dados oferecidos de uma forma significativa e útil para os indivíduos. Dados são correntes de fatos brutos que importam eventos que estão ocorrendo nas organizações ou no ambiente físico, antes de terem sido organizados e arranjados de uma forma que as pessoas possam entendê-los e usá-los.

Todo Sistema de Informação que manipula dados e gera informação, usando ou não recursos de tecnologia em computadores, pode ser genericamente considerado como um sistema de informação. Por exemplo, o sistema de informação organizacional pode ser conceituado como a organização e seus vários subsistemas internos, contemplando ainda o meio ambiente

Para Laudon, um sistema de informação pode ser definido como um conjunto de componentes inter-relacionados trabalhando juntos para coletar, recuperar, processar, armazenar e distribuir informações, com a finalidade de facilitar o planejamento, o controle, a coordenação, a análise e o processo decisório em organizações. De acordo com Turban; Maclean; Wetheber, o sistema de informação coleta, processa, armazena, analisa e dissemina informações com um determinado objetivo dentro de um contexto e como qualquer outro sistema inclui inputs (dados, instruções) e outputs (relatórios, cálculos). O sistema opera dentro de um ambiente, não necessariamente computadorizado, mesmo que atualmente a maioria seja, processa os inputs, que são enviados para os usuários e outros sistemas.

Page 4: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

4 www.acasadoconcurseiro.com.br

Os sistemas de informações podem ser classificados a princípios com formais ou informais. Os sistemas de informação formais incluem processo pré-definidos, entrada e saídas padronizadas e definições fixas. Quantos as informais, estes assumem diversas formas, que vão desde uma rede de comunicação informal em uma empresa, até um grupo de amigos que troca correspondência eletronicamente.

Sistema de Informação (SI) é um conjunto organizado de pessoas, hardware, software, redes de comunicações e recursos de dados, que coleta, transforma e dissemina informações na organização.

Recursos humanos: analistas de sistemas, programadores, administradores de dados, engenheiro de software, analista de teleprocessamento, usuários finais, entre outros.

Recursos de hardware: máquinas, como computadores, monitores de vídeo, unidades de disco magnético, impressoras, scanners, entre outros.

Recursos de software: programas de computadores como software básico, aplicativos/ferramentas, outros sistemas de informação.

Recursos de dados: arquivos, cadastros, bases de dados de clientes, funcionários, produtos, transações comerciais, ordens de produção, movimentação de materiais.

Recursos de rede: facilidades, serviços e meios de comunicação.

Classificação dos Sistemas de Informação

A – Conforme as comunidades de clientes predominantes

Para o administrador de sistemas de informação esta é a forma mais interessante de se classificar os sistemas de informação, por ser a mais próxima da realidade dos clientes/usuários.

Page 5: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

5www.acasadoconcurseiro.com.br

B – Conforme as tecnologias empregadas

• Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento de dados hierárquico, interação apenas com o operador técnico, hardware centralizado e restrito a CPU, unidades de armazenamento de dados em fitas, impressora e console do operador. Para os negócios esta geração de sistemas auxiliou na automação de tarefas manuais, que envolviam manipulação de dados massivos, resultando na redução de custos operacionais. Exemplo típico foram os sistemas de tabulação de dados de censo demográfico e transferência monetárias entre bancos (DOC).

• Sistemas de transação com o usuário, ou sistemas “online”: caracterizados pelas técnicas de programação, projeto e análise de sistemas estruturados, sistema de armazenamento de dados em rede, sistema transacional de interação direta com os usuários finais, gerenciamento dos sistemas de forma centralizada. Esta solução ampliou as oportunidades de automação das atividades, que necessitavam de interatividade, melhorou a qualidade dos trabalhos pela padronização e facilidades de controle centralizado das atividades realizadas em diferentes localidades. Exemplo típico foram os sistemas de reserva de passagens aéreas.

• Sistemas cliente servidor, ou sistema “client-server”: caracterizados por recursos distribuídos para processamento, armazenamento e impressão de dados, bases de dados relacionais e transferência do gerenciamento dos recursos de TI para os usuários. Flexibilizou os investimentos em TI e os negócios, permitindo que cada área adotasse soluções específicas e compatíveis com suas reais necessidades. Trouxe a integração dos sistemas de informação por processos, alterando a visão administrativa departamental ou verticalizada, para processos corporativos ou horizontais. Exemplo típico foram os sistemas de gestão empresarial (Enterprise Resource Planning).

• Sistemas baseados em Internet, ou solução “e-business”: utilizam a rede de comunicação da Internet, para trocarem informações; possuem grande facilidade para comunicação com usuários internos e externos à empresa; a solução pode ser gerenciada e composta por diferentes fornecedores. Em termos de negócio, os sistemas baseados em Internet permitem atingir um público irrestrito, a qualquer momento, independente de local ou equipamento específico. Disponibiliza aos clientes o maior número possível de facilidades no relacionamento com a empresa. Exemplo típico são as livrarias virtuais como amazon.com ou ainda os sites de serviços bancários.

Page 6: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

6 www.acasadoconcurseiro.com.br

C – Conforme os processos de negócio atendidos

Comercialização (compras e vendas)

Soluções e-commerce

• Loja virtual • Marketplace • Leilão (ou leilão reverso) • e-procurement • e-sourcing

Capacitação de recursos humanos (treinamento)

Soluções e-learning

• Treinamento baseado em computador (computer based training – CBT)

• Treinamento baseado na web (web-based training – WBT)

Relacionamento com clientes

Soluções CRM (customer relationship management)

• CRM analítico • CRM operacional • CRM colaborativo

Distribuição e logística

Soluções SCM (supply chain management)

• Web-based SCM • Collaborative Planning, Forecasting and Replenishment (CPFR)

Administrativos e financeiros

Soluções ERP (enterprise resource planning)

• Web-based ERP • ERP na modalidade ASP

Gestão de Produtos

Soluções PLM (product life-cycle management)

• CAD (computer aided design) • CAM (computer aided manufacturing) • PDM (product data management)

Os principais tipos sistemas de informação nas empresas são:

Sistemas de processamento de transações (SPTs): tem a funções de realizar e registra as transações e informações necessárias para funcionamento da organização.

Sistemas de informações gerenciais (SIGs): desenvolve relatórios sobre o desempenho atual da organização, permitindo monitorar e controlar a empresa e até mesmo prevê seu desempenho futuro.

Sistema de apoio à decisão (SADs): sistema que foca em problemas únicos alterando-se com rapidez e que não possui procedimentos de resoluções pré-definidos. Esse sistema utiliza informações obtidas pelo SPT e SIG e também informações externas que auxiliaram na análise e na resolução do problema.

Page 7: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

7www.acasadoconcurseiro.com.br

Sistema de apoio ao executivo (SAEs): auxilia a gerência com a apresentação de gráficos e dados de diversas fontes através de uma interface de fácil manuseio. Estes sistemas são projetados para incorporar dados sobre eventos externos, como novas leis ou novos concorrentes, utilizando também informações do SIG e do SAD internos. Filtram, condensam dados críticos, mostrando apenas os mais importantes para gerência.

Fases de um sistema de informação

Levantamento de requisitos

Os requisitos podem ser descrições de como um sistema de informação se deve comportar, das suas propriedades e das suas restrições ou condicionantes do seu desenvolvimento. A fase de levantamento de requisitos é, então, de extrema importância, pois é ela que garante que o novo sistema de informação será capaz de fazer o que é suposto fazer.

Desenvolvimento de sistemas de informação

Existem duas abordagens principais distintas para o desenvolvimento de sistemas de informação:

Desenvolvimento à medida: Construção do sistema corresponde diretamente aos requisitos da organização/dos usuários. Implica, tipicamente, um grande investimento, nomeadamente no que refere os recursos internos qualificados.

Desenvolvimento por pacotes: Construção do sistema através da aquisição de um pacote de soluções de software já desenvolvidas, que correspondem mais ou menos aos requisitos pedidos pela organização/pelos usuários. Implica, tipicamente, um maior trabalho de configuração e adaptação, que pode ser mais ou menos complexo e envolver mais ou menos recursos dependendo do sistema.

Existem diversos modelos para o desenvolvimento de Sistemas de Informação:

Modelo Waterfall (ou “em cascata”) é um modelo de desenvolvimento de software/sistemas de informação sequencial, isto é, no qual as fases se sucedem umas às outras de forma constante (como o fluir de uma cascata).

Page 8: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

8 www.acasadoconcurseiro.com.br

Modelo em Espiral – O modelo em espiral é um modelo de desenvolvimento de software/sistemas de informação cíclico onde, em cada ciclo, existem fases de avaliação e planeamento.

Modelo Agile – é um modelo de desenvolvimento de software/sistemas de informação que tem como objetivo minimizar o risco através do desenvolvimento em janelas de tempo pequenas, chamadas de iterações. Cada iteração é um “miniprojeto” que inclui todas as fases necessárias à criação de novo software

Testes ao sistema de informação

Os testes são fundamentais para garantir a qualidade do sistema. É nesta fase que os erros são detectados, criando a oportunidade para aperfeiçoar o software. O problema é que esta fase implica tempo e recursos. Grande parte dos custos de desenvolvimento de sistemas advém, precisamente, da realização de testes.

Page 9: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

9www.acasadoconcurseiro.com.br

Implementação de sistemas de informação

Consiste na “entrega” dos mesmos às organizações, isto é, na integração dos sistemas no ambiente organizacional cliente para que possam iniciar a sua atividade. Esta fase implica, não só, a implementação do sistema de informação tecnológico, mas também do sistema de atividades humanas (papéis/atividades dos usuários).

Manutenção de sistemas de informação

Consiste no processo de aplicar mudanças aos sistemas durante a sua vida útil, de acordo com as necessidades da organização e/ou dos usuários. Por isto, é essencial para garantir o bom funcionamento dos SI. A manutenção permite resolver problemas como:

• Bugs no sistema; • Mudanças nos processos; • Alterações nos requisitos dos stakeholders/usuários; • Problemas técnicos com hardware e/ou software; • Mudanças no ambiente.

Avaliação de sistemas de informação

Avaliar é a capacidade de explorar propriedades dos sistemas de informação, de forma a medir ou descrever a diferença que os sistemas fazem para as organizações e/ou para os usuários.

Page 10: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento
Page 11: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br 11

Questões

1. (2017 – IESES – IGP-SC – Perito Criminal em Informática)

“Os leitores dos jornais continuam a di-minuir, mais de 78 milhões de pessoas re-cebem suas notícias on-line. Cerca de 39 milhões de pessoas assistem a um vídeo online todos os dias e 66 milhões leram um blog. Ocorrem 16 milhões de postagem em blogs, criando uma explosão de novos escri-tores e novas formas de feedback dos clien-tes que não existiam há 10 anos atrás. O site de redes sociais Facebook atrai 134 milhões mensalmente e mais de 500 milhões em todo o mundo. Empresas estão começando a usar ferramentas de rede social para co-nectar seus funcionários, clientes e geren-tes em todo o mundo. Muitas empresas que frequentam o Fortune 500 agora têm Pági-nas do Facebook.”

A partir das ideias expressas no texto acima, conclui-se que:

a) Os sistemas de informações estão trans-formando negócios.

b) A troca contínua de tecnologias digitais aumentou o número de certificações digitais.

c) As videoconferências fazem parte in-contestavelmente do cotidiano.

d) As leis de segurança requerem o arma-zenamento de documentos on-line por 5 anos.

2. (2017 – CS-UFG – CELG/GT-GO – Analis-ta Técnico – Analista de Infraestrutura em Tecnologia da Informação T.I)

Software de gerenciamento de relaciona-mento com o cliente (CRM) pode ajudar uma organização a melhorar as interações com os clientes. Um princípio básico de CRM é que qualquer contato com o cliente deve ser feito com base em todas as infor-

mações sobre as interações passadas com esse cliente. Qual das seguintes definições caracteriza uma atividade que faz parte da essência de um software CRM?

a) Gerenciamento de campanhas de ven-das: organizar banco de dados com di-versos tipos de informação promocio-nal sobre a organização e disponibilizar esse material de marketing para repre-sentantes de vendas da organização.

b) Análise de mercado: compilar informa-ções sobre oportunidades de negócio e novos nichos de mercado para expan-dir a carteira de clientes da organização por meio de ações de inovação, pesqui-sa e desenvolvimento.

c) Marketing personalizado: enviar ofertas padronizadas de produtos e promoções para todos os clientes registrados com o objetivo de atender a necessidades financeiras ou de giro de estoque da or-ganização.

d) Automação da força de vendas: enca-minhar automaticamente clientes que entram em contato para um represen-tante de vendas, incluindo dados que ajudem a definir as necessidades do cliente com base no histórico de rela-cionamento.

3. (2017 – UFMT – UFSBA – Administrador)

Considerando os elementos componentes dos Sistemas de Informação (SI) baseados em computadores, numere a coluna da di-reita de acordo com a da esquerda.

1 – Hardware 2 – Software 3 – Banco de Dados 4 – Redes e Telecomunicações 5 – Processamento 6 – Recursos Humanos

Page 12: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br12

( ) Recurso responsável por armazenar de forma estruturada um conjunto de dados e de informações sobre uma determinada or-ganização.

( ) Infraestrutura que permite interligar, local e mundialmente, hardwares, softwa-res e bancos de dados.

( ) Programa de computadores que de-sempenha funções específicas de apoio ao usuário final, envolvendo aplicações.

( ) Elementos mais importantes de um Sistema de Informação (SI) computadoriza-do, sendo aqueles que utilizam a informáti-ca como ferramenta (atividade meio) para atingirem seus objetivos, ou aqueles que nela são especializados.

( ) Corresponde aos equipamentos com-putacionais necessários para a coleta, o processamento, o armazenamento e a dis-tribuição da informação.

( ) Conjunto de instruções que engloba as normas, as regras e as políticas especifica-das nos manuais da organização, que de-finem como utilizar, manipular e tratar as informações, além dos processos adminis-trativos que necessitam de informações.

Assinale a sequência correta.

a) 3, 4, 2, 6, 1, 5 b) 6, 5, 1, 4, 2, 3 c) 4, 6, 5, 1, 3, 2 d) 5, 3, 1, 6, 2, 4

4. (2016 – IF-RS – IF-RS – Professor – Enge-nharia de Produção)

Analise as afirmativas, identificando com “V” as VERDADEIRAS e com “F” as FALSAS, e assinale a alternativa CORRETA, na sequên-cia de cima para baixo.

( ) Um sistema de informação pode ser de-finido como um conjunto de componentes interrelacionados que coletam, processam, armazenam e distribuem informações desti-nadas a apoiar a tomada de decisões, a co-ordenação e o controle de uma organização.

( ) Um sistema de informação possui três atividades básicas: entrada, processamen-to e saída, ou seja, os dados são coletados/capturados, processados e apresentados de forma adequada. Além disso, os sistemas de informação requerem um feedback para análise e melhoramentos dos dados de en-trada.

( ) Os sistemas de informações lidam com questões técnicas e comportamentais, apresentando três dimensões: as organiza-ções, as pessoas e a tecnologia de informa-ção. A tecnologia de informação é a dimen-são mais importante, em função do custo de aquisição de hardware e software e de implantação de uma infraestrutura de intra-net e internet.

( ) Os sistemas ERP possuem capacidade de armazenamento de informações sobre transações operacionais e financeiras, orga-nizadas em módulos. O módulo que trata de logística visa programar a produção, alocar os recursos e definir quais componentes se-rão utilizados em cada etapa da produção. O TMS é um sistema de gerenciamento de armazéns ou depósitos.

a) V – V – F – V. b) V – V – F – F. c) V – F – V – V. d) V – F – F – F. e) F – F – V – V.

5. (2016 – FCC – TRF – 3ª REGIÃO – Analista Judiciário – Área Administrativa)

Um Analista Judiciário da Área Administrati-va do TRF3 deseja solicitar ao departamento de Tecnologia da Informação − TI o desen-volvimento de um sistema de informação para fazer com que cada vez que uma resma de 500 folhas de papel sulfite seja retirada do estoque, um registro apareça, automati-camente, nos computadores da empresa fa-bricante e fornecedora de papel sulfite, de forma que ela possa fabricar a quantidade necessária e enviar diretamente ao TRF3, eliminando distribuidores e reduzindo cus-

Page 13: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br 13

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

tos de armazenamento. Neste caso, o sis-tema de informação que o Analista deseja solicitar é um

a) Customer Relationship Management − CRM.

b) Supply Chain Management − SCM. c) Enterprise Resource Planning − ERP. d) Knowledge Management System −

KMS. e) Transaction Support System − TSS.

6. (2018 – CS-UFG – SANEAGO – GO – Admi-nistrador)

Os sistemas de informação projetados com o objetivo de apoiar a organização na exe-cução de atividades básicas específicas, ro-tineiras e estruturadas denominam-se:

a) Sistemas de Informações Gerenciais. b) Sistemas de Processamento de Transa-

ções. c) Sistemas de Apoio Executivo. d) Sistemas Inteligentes Especialistas.

7. (2017 – UFMT – UFSBA – Administrador)

A classificação dos Sistemas de Informação computadorizados apresenta como critério de categorização o nível organizacional ao qual eles buscam atender, sendo definidos em três categorias essenciais:

a) Sistema de Suporte à Decisão (SSD), Sis-tema de Gerenciamento da Cadeia de Suprimentos (SGCS) e Sistema de Ge-renciamento do Relacionamento com o Consumidor (SGRC).

b) Sistema de Gerenciamento da Cadeia de Suprimentos (SGCS), Sistema de Pro-cessamento de Transação (SPT) e Sis-tema de Gerenciamento do Relaciona-mento com o Consumidor (SGRC).

c) Sistema de Informação Gerencial (SIG), Sistema de Suporte à Decisão (SSD) e Sistema de Gerenciamento do Relacio-namento com o Consumidor (SGRC).

d) Sistema de Processamento de Transa-ção (SPT), Sistema de Informação Ge-rencial (SIG) e Sistema de Apoio à Deci-são (SAD).

8. (2014 – CESPE – ANATEL – Analista Admi-nistrativo – Desenvolvimento de Sistemas)

Julgue os itens subsequentes, relativos aos sistemas de processamento transacional. No nível gerencial médio das empresas, en-contram-se os sistemas de informações ge-renciais, os sistemas de apoio a decisão e os sistemas de apoio aos executivos.

( ) Certo   ( ) Errado

9. (2014 – CESPE – ANATEL – Analista Admi-nistrativo – Desenvolvimento de Sistemas)

Julgue os itens subsequentes, relativos aos sistemas de processamento transacional. No nível de conhecimento e execução das empresas, o apoio aos trabalhadores é dado pelos sistemas de trabalho em conhecimen-to, sistemas de automação de engenharia e sistemas de automação de escritório.

( ) Certo   ( ) Errado

10. (2014 – CESPE – ANATEL – Analista Admi-nistrativo – Desenvolvimento de Sistemas)

Julgue os itens a seguir, acerca de sistemas de gestão de conteúdo. Os portais corpora-tivos são construídos com a finalidade de oferecer ao público em geral espaços para que ele realize visitas virtuais às empresas.

( ) Certo   ( ) Errado

11. (2013 – CESPE – SERPRO – Analista – De-senvolvimento de Sistemas)

Em relação a sistemas de suporte à deci-são e gestão de conteúdo, julgue os itens subsequentes. Sistemas de apoio à decisão são sistemas que, substituindo a interven-ção humana, tomam decisão em situações críticas que envolvem o processamento de grande volume de informações em paralelo.

( ) Certo   ( ) Errado

Page 14: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br14

12. (2013 – CESPE – SERPRO – Técnico – Pro-gramação e Controle de Serviços de Tecno-logia da Informação)

Julgue os itens seguintes, relativos à arqui-tetura e às tecnologias de sistemas de infor-mação. Por meio da arquitetura de sistemas de informação, é estabelecido um conjunto de elementos para o mapeamento da orga-nização quanto aos fatores envolvidos no processo de desenvolvimento e implanta-ção de sistemas de informação.

( ) Certo   ( ) Errado

13. (2013 – Banca: CESPE – Órgão: ANP – Pro-va: Analista Administrativo – Área 4)

Considerando os conceitos de sistemas de informação e de tecnologia da informação, julgue os itens a seguir. O sistema de infor-mação permite agregar valor às organiza-ções, uma vez que se trata de um recurso valioso e repercute em todos os níveis da estrutura organizacional: estratégico, ope-racional e administrativo.

( ) Certo   ( ) Errado

14. (2013 – CESPE – ANP – Analista Administra-tivo – Área 4)

Considerando os conceitos de sistemas de informação e de tecnologia da informação, julgue os itens a seguir. Os sistemas de in-formação podem ser classificados pelo grau de formalidade, pelo grau de automatiza-ção aplicado e pela natureza dos inputs e outputs.

( ) Certo   ( ) Errado

15. (2013 – CESPE – ANP – Analista Administra-tivo – Área 4)

Considerando os conceitos de sistemas de informação e de tecnologia da informação, julgue os itens a seguir. É importante distin-guir dois níveis, no que diz respeito a siste-mas de informação: nível de aplicação, em que se determinam os ambientes de aplica-ção como industrial, administrativo e gover-namental e nível físico, em que se definem as infraestruturas de hardware a utilizar.

( ) Certo   ( ) Errado

16. (2013 – CESPE – ANP – Analista Administra-tivo – Área 4)

Considerando os conceitos de sistemas de informação e de tecnologia da informação, julgue os itens a seguir. A tomada de deci-são nas organizações é facilitada pela uti-lização da tecnologia da informação, que permite criar, administrar e manter a gestão da informação de uma instituição por meio de dispositivos para acesso, operação e ar-mazenamento de dados.

( ) Certo   ( ) Errado

Gabarito: 1. A 2. D 3. A 4. B 5. B 6. B 7. D 8. Errado 9. Certo 10. Errado 11. Errado 12. Certo  13. Certo 14. Certo 15. Errado 16. Certo

Page 15: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

15www.acasadoconcurseiro.com.br

TEORIA DA INFORMAÇÃO

A Teoria da informação ou Teoria matemática da comunicação foi criada em 1948 e é um ramo da teoria da probabilidade e da matemática estatística que lida com sistemas de comunicação, transmissão de dados, criptografia, codificação, teoria do ruído, correção de erros, compressão de dados, entre outros.

Claude E. Shannon (1916-2001) é conhecido como “o pai da teoria da informação”. Sua teoria foi a primeira a considerar comunicação como um problema matemático rigorosamente embasado na estatística e deu aos engenheiros da comunicação um modo de determinar a capacidade de um canal de comunicação em termos de ocorrência de bits. A teoria não se preocupa com a semântica dos dados, mas pode envolver aspectos relacionados com a perda de informação na compressão e na transmissão de mensagens com ruído no canal.

A Teoria da Informação é, sobretudo, uma teoria matemática que trata de três conceitos básicos:

• A medida da informação • A capacidade de um canal de comunicações transferir informação • A codificação, como meio de utilizar os canais com toda a sua capacidade

Shannon, Weaver e Wiener, nas suas investigações, tinham um objetivo instrumental – conseguir a máxima economia de tempo, energia e dinheiro no desenho dos sinais e canais técnicos de transmissão. Isto quer dizer:

1) problemas técnicos da transmissão; 2) semânticos – que significados se transmite; 3) influência – o que afeta a mensagem no receptor.

Contudo, o destaque da teoria da informação foi para as questões técnicas, sendo a primeira teoria a separar nitidamente a informação da significação.

A teoria da informação (TI) mostra a informação como medida probabilística e se interessa-se pelo funcionamento dos sinais, pelas transformações energéticas mediante a codificação da mensagem e sua decodificação. Opera com os seguintes conceitos: ruído, redundância, entropia e imprevisibilidade.

Page 16: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

16 www.acasadoconcurseiro.com.br

Dion (1997) considera que a noção de entropia se revelaria imediatamente apta para estudar as línguas. A teoria da informação não estuda uma língua pelo número de símbolos alfabéticos que a compõem, mas também pela análise à redundância na língua (o inverso da entropia é a redundância, ou neguentropia, enquanto caminho para a ordem). Uma língua entrópica dispõe de um vocabulário rico, com palavras diferenciadas, que mostram o poder das combinatórias; uma língua pouco entrópica é pobre e repetitiva.

A informação é uma medida (estatística) da probabilidade de ocorrência = grau de novidade ou imprevisibilidade (Abril, 1997). O bit (binary digit) é a unidade base de medida da informação entre duas alternativas igualmente prováveis. Exemplo: amanhã vai fazer sol/amanhã vai chover ↔ um bit de informação: sim/não.

Quando, entre dois eventos, sabemos qual deles irá acontecer, temos uma informação. Se jogo para o alto uma moeda (e aposto cara ou coroa) tenho uma probabilidade de 1/2 para cada lado da moeda. No caso do dado e suas seis faces, tenho para cada face uma probabilidade de 1/6. No xadrez, há 64 probabilidade de diferentes realizações (por exemplo: qual das casas do tabuleiro de xadrez será a escolhida?) A teoria da informação chama unidade de informação ou bit a unidade de disjunção binária que serve para individualizar uma alternativa. Para individualização de um, entre oito elementos, recebi 3 bits de informação; no caso de sessenta e quatro elementos, eu receberia 6 bits”.

Conceitos de dado, informação, conhecimento e inteligência

É importante distinguir dados, informação, conhecimento e acrescentar o conceito de inteligência. Considerando uma tabela fictícia, o valor 35 na 1ª linha com a 2ª coluna é um dado. Dados são representações de informações. Sozinhos não dizem nada. Quando entendemos que o 35 significa a idade do cliente José, por exemplo, estamos transformando o dado em informação. As pessoas trabalham com informações, mas a tecnologia armazena dados.

Já conhecimento seria: “Todos os clientes da cidade de SP têm saldo médio maior que 9 mil reais”. Notem, isto não é uma informação que está explícita na tabela. Só conseguimos chegar a esse conhecimento se cruzarmos informações diferentes. Conhecimento, portanto, vem das informações. Mas está acima. As pessoas recebem muitas informações no seu dia a dia, mas nem tudo fica retido, nem tudo é útil, nem tudo será utilizado mais adiante. O que resta, o que é útil, o que é utilizado forma o conhecimento desta pessoa.

Já o conceito de inteligência (alguns chamam de sabedoria) está acima do conhecimento. Imagine um grupo de pessoas numa sala fechada (nada entra ou sai) recebendo uma tarefa: quebrar a cadeira onde estão sentados. Admitamos que todos possuem a mesma força física e foram criados e educados em famílias e escolas semelhantes. Ou seja, possuem o mesmo nível de conhecimento, obtido por estudos nas escolas, leitura em casa, viagens, experiência, etc. Algumas destas pessoas conseguirão resolver o problema e outras não. Mas por que, se todas possuem a mesma força física e os mesmos conhecimentos? A diferença está na forma como cada um utiliza o conhecimento que tem e as conexões que faz em seu cérebro. Isto é inteligência, ou seja, saber resolver problemas utilizando o conhecimento que possui. E isto se aplica também em poder resolver problemas novos, usando adaptações, analogias, etc.

Page 17: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

17www.acasadoconcurseiro.com.br

Tenha em mente que os altos volumes de dados e informações nem sempre geram conhecimento se não forem adequadamente interpretados, além disso, a qualidade dos dados deve ser considerada para a adequada apuração e geração da informação e consequentemente obtenção do conhecimento.

Dados

Dados são códigos que constituem a matéria prima da informação, ou seja, é a informação não tratada. Os dados representam um ou mais significados que isoladamente não podem transmitir uma mensagem ou representar algum conhecimento.

Em uma pesquisa eleitoral por exemplo, são coletados dados, isto é, cada participante da pesquisa fornece suas opiniões e escolhas sobre determinados candidatos, mas essas opiniões não significam muita coisa no âmbito da eleição. Só depois de ser integrada com as demais opiniões é que teremos algo significativo.

Outro exemplo seria em uma investigação policial por exemplo. Inicialmente colhe-se depoimentos, analisa pistas e busca qualquer tipo de dado que possa ser útil. Contudo, isoladamente esses dados não vão dizer quem é o criminoso.

Informações

Informações são dados tratados. O resultado do processamento de dados são as informações. As informações têm significado, podem ser tomadas decisões ou fazer afirmações considerando as informações.

No exemplo da pesquisa eleitoral, os pesquisadores retêm dados dos entrevistados, mas quando inseridos nos sistemas e processados produzem informações e essas informações diz que tem mais chance de ser eleito, entre outras.

No exemplo anterior da investigação policial, ainda que de forma manual, os investigadores irão reunir todos os dados, analisar, processar e chegar a relatórios informativos que darão ao juiz, advogados e promotores as informações necessárias para realizar o julgamento. Salvo engano, isto é chamado de inquérito policial.

Desta forma podemos dizer que as informações é o conjunto de dados que foram processados, seja por meio eletrônico, mecânico ou manual e que produziu um resultado com significado.

Conhecimento

O conhecimento vai além de informações, pois ele além de ter um significado tem uma aplicação. Veja aqui os tipos de conhecimento.

Conhecimento é o ato ou efeito de abstrair ideia ou noção de alguma coisa, como por exemplo: conhecimento das leis; conhecimento de um fato (obter informação); conhecimento de um documento; termo de recibo ou nota em que se declara o aceite de um produto ou serviço; saber, instrução ou cabedal científico (homem com grande conhecimento).

Page 18: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

18 www.acasadoconcurseiro.com.br

As informações são valiosas, mas o conhecimento constitui um saber. Produz ideias e experiências que as informações por si só não será capaz de mostrar. Se informação é dado trabalhado, então conhecimento e informação trabalhada.

Dados são puramente sintáticos enquanto informação contém, necessariamente, semântica. Conhecimento é uma abstração interior relacionada a alguma coisa existente no mundo real e do qual temos uma experiência direta”

Page 19: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br 19

Questões

1. (2010 – FGV – FIOCRUZ – Tecnologista em Saúde – Informação Científica e Imagem em Saúde)

A análise técnica de uma imagem a partir dos preceitos da Teoria da Informação, ne-cessariamente, deve:

a) valorizar os significados. b) desmaterializar a comunicação. c) negar quantitativamente a informação. d) diferenciar informação de significação. e) desconsiderar a performance da comu-

nicação.

2. (2014 – MS CONCURSOS – UFAC – Adminis-trador)

Observe os itens a seguir quanto à Aborda-gem Sistêmica da Administração e marque a alternativa correta:

I – A teoria da informação é um ramo da matemática aplicada que utiliza o cálculo da probabilidade.

II – A cibernética é uma ciência relativamen-te jovem e que foi assimilada pela Informá-tica e pela Tecnologia da Informação.

III – A automação é uma síntese de ultrame-canização, super-racionalização, processa-mento contínuo e controle automático.

a) Somente o item I está correto. b) Somente o item II está correto. c) Somente o item III está correto. d) Somente os itens I e III estão corretos. e) Todos os itens estão corretos.

3. (2016 – FUNIVERSA – IF-AP – Relações Publi-cas)

Na década de 1940, quando Claude Shan-non e Warren Weaver desenvolveram os primeiros conceitos acerca da Teoria da Informação, os Estados Unidos viviam um momento de intenso desenvolvimento tec-nológico, sobretudo dos meios de comuni-cação de massa. Ali foram lançadas as bases para a evolução da informatização.

A respeito dessa teoria, assinale a alternati-va correta.

a) Os pesquisadores estavam preocupa-dos em compreender os efeitos nocivos da mídia sobre as massas.

b) O foco central era analisar os conteúdos semânticos das mensagens dos meios de comunicação.

c) Shannon e Weaver foram responsáveis pela criação do conceito de cibernética e robótica.

d) A pesquisa objetivava a melhoria das transmissões telefônicas, a diminuição das distorções e o melhor rendimento da comunicação por via tecnológica.

e) Ao analisar o processo de comunicação entre emissor e receptor, por meio de um canal, eles se focaram nas mensa-gens e desprezaram a existência de ru-ídos.

4. (2018 – CESPE – ABIN – Oficial Técnico de Inteligência – Área 7)

Considerando 1,6 como valor aproximado para log2 3, julgue o próximo item, a respei-to de entropia na teoria da informação. A entropia de um dado honesto é igual a 3,6.

( ) Certo   ( ) Errado

Page 20: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br20

5. (2013 – CESPE – SERPRO – Analista – Su-porte Técnico)

Julgue o próximo item, referente a seguran-ça física. O conceito de perímetro de segu-rança deriva de técnicas matemáticas for-muladas a partir da teoria da informação, sendo utilizado para criação de áreas físicas para isolar as pessoas dos ativos de infor-mação da organização.

( ) Certo   ( ) Errado

6. (2018 – CESPE – TCM-BA – Auditor Estadual de Controle Externo)

O diretor de uma montadora de veículos necessita tomar uma decisão acerca da continuidade ou não de um dos produtos vendidos no Brasil. Para tanto, solicitou um relatório sobre as vendas de carros da mar-ca do último trimestre de 2018, por faixa de preço, região, modelo e cor. Nessa situação, no contexto de análise da informação, o re-latório representa

a) conhecimento. b) inteligência. c) dados. d) informação. e) sabedoria.

7. (2013 – CESPE – ANP – Analista Administra-tivo – Área 4)

Considerando os conceitos de sistemas de informação e de tecnologia da informação, julgue os itens a seguir. Dados são o resulta-do do processamento da informação, após análise, de acordo com uma ótica predeter-minada.

( ) Certo   ( ) Errado

Gabarito: 1. D 2. E 3. D 4. Errado 5. Errado 6. D 7. Errado

Page 21: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

21www.acasadoconcurseiro.com.br

BANCO DE DADOS

1. Introdução ao Banco de Dados

Muitos autores definem Bancos de dados (BD) de forma diferente, porém em todas elas tem-se uma ideia de coleção ou conjunto de dados armazenados que servem ou são usados por algumas situações específicas. A definição de banco de dados como ‘uma coleção de dados relacionados’ é muito geral.

Por exemplo, considere a coleção de palavras deste texto como sendo dados relacionados e, portanto, constitui um banco de dados. Entretanto, o uso comum do termo ‘banco de dados’ é usualmente mais restrito.

O conceito de banco de dados está muito presente em nosso dia-a-dia e faz parte de nossa vida. Banco de dados (BD) desempenha um papel crítico em muitas áreas onde computadores são utilizados

O BD está presente em muitas áreas diferentes (negócios, engenharia, educação, medicina, etc.). Um arranjo aleatório de dados não pode ser considerado um banco de dados

1.1 Conceitos Básicos

1.1.1 Definições comuns

1. Um banco de dados “é uma coleção de dados inter-relacionados, representando informações sobre um domínio específico”, ou seja, sempre que for possível agrupar informações que se relacionam e tratam de um mesmo assunto, posso dizer que tenho um banco de dados.

2. É uma coleção de dados logicamente coerente que possui um significado implícito cuja interpretação dada por uma determinada aplicação;

3. Representa abstratamente uma parte do mundo real, conhecida como Minimundo ou Universo de Discurso (UD), que é de interesse de certa aplicação;

Podemos exemplificar situações clássicas como a lista de contatos de telefone celular, um catálogo de CDs/DVDs ou um sistema de controle de RH de uma empresa.

Já um sistema de gerenciamento de banco de dados (SGBD) é um software que possui recursos capazes de manipular as informações do banco de dados e interagir com o usuário. Exemplos de SGBDs são: Oracle, SQL Server, DB2, PostgreSQL, MySQL, o próprio Access ou Paradox, entre outros.

Page 22: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

22 www.acasadoconcurseiro.com.br

Por último, temos que conceituar um sistema de banco de dados como o conjunto de quatro componentes básicos: dados, hardware, software e usuários.

Os objetivos de um sistema de banco de dados são o de isolar o usuário dos detalhes internos do banco de dados (promover a abstração de dados) e promover a independência dos dados em relação às aplicações, ou seja, tornar independente da aplicação, a estratégia de acesso e a forma de armazenamento.

1.2 Abstração de dados

O sistema de banco de dados deve garantir uma visão totalmente abstrata do banco de dados para o usuário, ou seja, para o usuário do banco de dados pouco importa qual unidade de armazenamento está sendo usada para guardar seus dados, contanto que os mesmos estejam disponíveis no momento necessário.

Esta abstração se dá em três níveis de arquitetura:

• Nível de visão do usuário: as partes do banco de dados que o usuário tem acesso de acordo com a necessidade individual de cada usuário ou grupo de usuários;

• Nível conceitual: define quais os dados que estão armazenados e qual o relacionamento entre eles;

• Nível físico ou interno: é o nível mais baixo de abstração, em que define efetivamente de que maneira os dados estão armazenados.

1.3 Modelo conceitual

É a descrição do BD de maneira independente ao SGBD, ou seja, define quais os dados que aparecerão no BD, mas sem se importar com a implementação que se dará ao BD. Desta forma, há uma abstração em nível de SGBD.

Uma das técnicas mais utilizadas dentre os profissionais da área é a abordagem entidade-relacionamento (ER), onde o modelo é representado graficamente através do diagrama entidade-relacionamento (DER).

Page 23: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

23www.acasadoconcurseiro.com.br

Figura 1 – Exemplo de diagrama entidade-relacionamento

O modelo acima, entre outras coisas, nos traz informações sobre Alunos e Turmas. Para cada Aluno, será armazenado seu número de matrícula, seu nome e endereço, enquanto para cada turma, teremos a informação de seu código, a sala utilizada e o período.

1.4 Modelo Lógico

O modelo Lógico descreve o BD no nível do SGBD, ou seja, depende do tipo particular de SGBD que será usado. Não podemos confundir com o Software (aplicação) que será usado.

Abordaremos o SGBD relacional, por ser a exigência da grande maioria das provas. Nele, os dados são organizados em tabelas.

Aluno

mat_aluno Nome Endereço

1 Cecília Ortiz Rezende Rua dos Ipês, 37

2 Abílio José Dias Avenida Presidente Jânio Quadros, 357

3 Renata Oliveira Franco Rua Nove de Julho, 45

Turma

cod_turma sala Período

1 8 Manhã

2 5 Noite

O modelo lógico do BD relacional deve definir quais as tabelas e o nome das colunas que compõem estas tabelas. Para o nosso exemplo, poderíamos definir nosso modelo lógico conforme o seguinte:

Aluno(mat_aluno, nome, endereco) Turma (cod_turma, sala, periodo)

É importante salientar que os detalhes internos de armazenamento, por exemplo, não são descritos no modelo lógico, pois estas informações fazem parte do modelo físico, que nada mais é que a tradução do modelo lógico para a linguagem do software escolhido para implementar o sistema.

Page 24: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

24 www.acasadoconcurseiro.com.br

1.5 Abstração de Dados

O grande objetivo de um sistema de BD é oferecer uma visão “abstrata” dos dados aos usuários. Os detalhes referentes à forma como estes dados estão armazenados e mantidos não interessa aos usuários, mas a disponibilidade eficiente destes dados é que são fundamentais.

O conceito de abstração está associado à característica de se observar somente os aspectos de interesse, sem se preocupar com maiores detalhes envolvidos.

No contexto de abstração de dados um banco de dados pode ser visto sem se considerar a forma como os dados estão armazenados fisicamente.

Exemplo: Um programador de aplicação não precisa se importar com aspectos físicos de armazenamento dos dados.

1.6 Dados e Informações

Dado denota um fato que pode ser registrado e possui significado implícito

Considere o nome e endereço de todas as pessoas que você conhece.

Informação denota uma organização em relação a um conteúdo.

1.7 Propriedades Implícitas De Banco De Dados

• Um banco de dados é uma coleção logicamente coerente de dados com algum significado inerente

• Um banco de dados é projetado e construído com dados para um propósito específico

• Ele possui um grupo de usuários e algumas aplicações pré-concebidas, as quais esses usuários estão interessados.

Page 25: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

25www.acasadoconcurseiro.com.br

1.8 Terminologia Básica Em Banco De Dados

Campo – unidade básica de informação mínima com significadoRegistro – conjunto de camposArquivo – conjunto de registrosBanco de Dados (BD) – conjunto de arquivos e as formas de manipulação

1.9 SGBD – Sistema Gerenciador De Banco De Dados

Um Sistema Gerenciador de Banco de Dados (SGBD) é uma coleção de programas que habilitam usuários a criar e manter um banco de dados.

O SGBD é um software de propósito geral, que facilita o processo de definição, construção e manipulação de um banco de dados.

Definição de banco de dados envolve especificar estruturas e tipos de dados para serem gravados no banco de dados, com uma descrição detalhada de cada tipo de dado. Construção de um banco de dados é o processo de consistir e gravar inicialmente dados no banco de dados.

Manipulação de um banco de dados inclui funções como consulta por dados específicos e atualização para refletir as alterações no mundo real.

1.10 Principais Atribuições de um SGBD

BD não contém somente os dados de conteúdo armazenados, ele também armazena definições e descrições sobre a estrutura que forma o BD (metadados).

Page 26: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

26 www.acasadoconcurseiro.com.br

O catálogo do sistema (metadados) contém definições da estrutura de cada arquivo, o tipo e formato de armazenamento de cada item de dados, e várias restrições dos dados.

Este catálogo é usado pelo SGBD e ocasionalmente por algum usuário do BD (não é específico, mas geral, atendendo as diversas necessidades de arquivos diferentes).

1.11 Características de um SGBD

• Controle sobre a redundância

• Espaço para armazenamento

• Duplicação de esforços

• Inconsistência na base de dados

• Compartilhamento de Dados

• Restrição de acesso não autorizado: Possui um sistema de segurança garantindo o acesso específico a cada usuário (personalizado para grupos ou individual), garantindo assim segurança no acesso ao BD, diferentes permissões de operação no BD, proteção de contas pessoais (ou grupo) por senhas, segurança no uso do próprio SGBD como nas criações de novas contas.

• Fornecimento de múltiplas interfaces (visões): Diversos níveis de conhecimento entre os usuários, onde o BD deve oferecer vários tipos de acesso aos dados.

• Forçar restrições de integridade: armazenamento de vários tipos de dados (inteiro, real, lógico), relacionamentos entre os dados, obrigatoriedade ou não de informação do dado (nulo ou não nulo), unicidade do dado (chave primária), dificultar a ocorrência de erros.

• Sistema de Backup e Recovery: Capacidade de salvamento e recuperação dos dados.

• Facilidade e controle do BD no caso de falha do hardware ou do software chegando a fazer uma recuperação da situação anteriormente encontrada, evitando duplicidade e dados inconsistentes.

1.12 Abordagem Relacional

Um BD relacional possui apenas um tipo de construção, a tabela. Uma tabela é composta por linhas (tuplas) e colunas (atributos). Os relacionamentos entre os dados também são representados ou por tabelas, ou através da reprodução dos valores de atributos.

1.12.1 Tabelas

Uma tabela é um conjunto não ordenado de linhas (tuplas ou registros). Cada linha é composta por uma série de colunas (atributos ou campos).

Cada campo é identificado por um nome de campo (nome de atributo). Um conjunto de campos homônimos de todas as linhas de uma tabela é uma coluna.

Page 27: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

27www.acasadoconcurseiro.com.br

Comparando tabelas de um banco de dados relacional com um arquivo convencional, observamos as seguintes diferenças:

As linhas de uma tabela não têm ordenação. A ordem de recuperação é arbitrariamente estabelecida pelo banco de dados.

Os valores de campo de uma tabela são atômicos e monovalorados;

As linguagens de consulta às bases de dados relacionais permitem o acesso por quaisquer critérios envolvendo os campos de uma ou mais linhas. Não há necessidade de especificar caminhos de acesso.

1.12.2 Chaves

Chaves são um conceito básico que permitem identificar linhas e estabelecer relações entre linhas e tabelas de um banco de dados relacional. Em um banco de dados relacional, há pelo menos quatro tipos de chaves a serem consideradas: chaves primárias, chaves estrangeiras, candidatas e chaves alternativas

É através das chaves que conseguimos estabelecer as regras para que o SGBD possa manter a integridade referencial.

1.12.3 Chave Primária

As chaves primárias são uma coluna (ou um conjunto delas) dentro de uma tabela que distinguem uma linha das demais. As chaves primárias podem ser compostas por mais de uma coluna, entretanto, devem sempre respeitar o princípio da minimalidade. Uma chave é mínima quando todas as suas colunas forem efetivamente necessárias para garantir o requisito da unicidade de valores da chave.

Na abordagem relacional, ao contrário dos sistemas convencionais de arquivos, por exemplo, uma chave não é um índice ou qualquer outra estrutura de acesso. As chaves fazem apenas a restrições de integridade, ou seja, regras que devem ser obedecidas em todos os estados válidos do BD.

1.12.4 Chave Estrangeira

Uma chave estrangeira é uma coluna ou uma combinação de colunas cujos valores aparecem necessariamente na chave primária de uma outra tabela. A chave estrangeira é o mecanismo que permite a implementação de relacionamentos em bancos de dados relacionais.

Page 28: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

28 www.acasadoconcurseiro.com.br

A existência de chaves estrangeiras impõe restrições que devem ser garantidas ao executar diversas operações de alterações no banco de dados.

I. Inclusão de uma linha na tabela que contém a chave estrangeira: Neste caso, deve-se garantir que o valor contido na chave estrangeira apareça na coluna da chave primária referenciada.

II. Alteração do valor de uma chave estrangeira: Deve-se assegurar que o novo valor aparece na coluna da chave primária referenciada;

III. Exclusão de uma linha da tabela que contém a chave primária referenciada pela chave estrangeira: Deve ser garantido que na coluna da chave estrangeira não apareça o valor da chave primária que será excluída.

IV. Alteração do valor da chave primária referenciada pela chave estrangeira: Deve ser garantido que na coluna da chave estrangeiras não apareça o valor da chave primária que está sendo alterada. Uma chave estrangeira não referencia, necessariamente, outra tabela. Em um auto relacionamento, o valor da chave estrangeira é o próprio valor da chave primária da mesma tabela.

1.13 Restrições de Integridade

Um dos objetivos primordiais de um SGBD é a integridade de dados. Dizer que os dados de um banco são íntegros significa dizer que eles refletem corretamente a realidade apresentada pelo banco de dados e são consistentes entre si. Uma restrição de integridade é uma regra de consistência de dados mantida pelo próprio SGBD. Na abordagem relacional, as restrições de integridade são abordadas nas seguintes categorias:

1.13.1 Integridade de entidade

Especifica que nenhum valor de chave primária pode ser nulo;

1.13.2 Integridade de Domínio

Um valor designado para um campo deve estar dentro do domínio previsto para aquele campo.

1.13.3 Integridade de Vazio

Através desta restrição de integridade é possível determinar se um campo pode conter valores nulos. Os campos que compõem a chave primária devem ser diferentes de vazio.

1.13.4 Integridade de Chave

Restrição que determina que os valores de chaves primárias e alternativas devem ser únicos.

1.13.5 Integridade Referencial

É a restrição que define que valores dos campos que aparecem em uma chave estrangeira devem estar presentes na coluna da chave primária da tabela referenciada.

Page 29: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

29www.acasadoconcurseiro.com.br

As restrições acima relatadas são garantidas automaticamente por um SGBD relacional e o programador não precisa se preocupar em escrevê-las através de programação.

Restrições semânticas geram outras restrições de integridade que, estas sim, devem ser garantidas através da codificação.

1.14 Formas normais

Diz-se que uma tabela num banco de dados relacional está numa certa forma normal se satisfaz certas condições. O trabalho original de Edgar F. Codd definiu três dessas formas, mas existem hoje outras formas normais geralmente aceitas. Damos aqui uma curta panorâmica informal das mais comuns. Cada forma normal listada abaixo representa uma condição mais forte que a precede na lista. Para a maioria dos efeitos práticos, considera-se que as bases de dados estão normalizadas se aderirem à terceira forma normal.

• Primeira Forma Normal (ou 1FN) requer que todos os valores de colunas em uma tabela sejam atômicos (ex., um número é um átomo, enquanto uma lista ou um conjunto não o são). A normalização para a primeira forma normal elimina grupos repetidos, pondo-os cada um em uma tabela separada, conectando-os com uma chave primária ou estrangeira.

• Segunda Forma Normal (ou 2FN) requer que não haja dependência funcional não-trivial de um atributo que não seja a chave, em parte da chave candidata.

• Terceira Forma Normal (ou 3FN) requer não haver dependências funcionais não-triviais de atributos que não sejam chave, em qualquer coisa exceto um superconjunto de uma chave candidata.

Page 30: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento
Page 31: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br 31

Questões

1. (2018 – CESPE – EBSERH – Analista de Tec-nologia da Informação)

Com relação a banco de dados, julgue o item seguinte. Em normalização, a primei-ra forma normal é caracterizada por uma tabela com a existência obrigatória de uma chave primária e uma chave estrangeira.

( ) Certo   ( ) Errado

2. (2018 – CESPE – EBSERH – Analista de Tec-nologia da Informação)

Com relação a banco de dados, julgue o item seguinte. Após um banco de dados ser criado, o administrador executa uma série de tarefas para dar permissão de acesso aos usuários que necessitam ler e gravar infor-mações na base de dados. A responsabilida-de de gerir os acessos ao banco de dados é do sistema gerenciador de banco de dados (SGBD).

( ) Certo   ( ) Errado

3. (2018 – CESPE – EBSERH – Técnico em In-formática)

Tendo como referência o modelo lógico precedente, julgue o item a seguir. A partir do modelo apresentado, infere-se que um hospital pode estar vinculado a várias uni-versidades, pois a tabela Hospital apresenta cardinalidade (0, n).

( ) Certo   ( ) Errado

Explicação: Uma Universidade pode ter de 0 a n hospitais. (0,n)

Um Hospital deve estar vinculado a uma Universidade (1,1)

4. (2018 – CESPE – EBSERH – Técnico em In-formática)

Tendo como referência o modelo lógico pre-cedente, julgue o item a seguir. Para que o modelo em questão seja implementado no sistema gerenciador de banco de dados re-lacional, deve-se criar, primeiramente, a ta-bela Universidade e, posteriormente, a ta-bela Hospital.

( ) Certo   ( ) Errado

5. (2018 – CESPE – EBSERH – Técnico em In-formática)

Julgue o item seguinte, a respeito de banco de dados distribuído e orientado a objetos. Em um banco de dados distribuído, os ser-vidores de banco envolvidos não precisam, necessariamente, possuir a mesma configu-ração de hardware.

( ) Certo   ( ) Errado

Page 32: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br32

6. (2018 – CESPE – EBSERH – Técnico em In-formática)

Julgue o item seguinte, a respeito de banco de dados distribuído e orientado a objetos. Em um ambiente distribuído, as diferentes topologias de redes utilizadas para a comu-nicação entre os bancos de dados não inter-ferem no desempenho dos bancos de dados quanto ao processamento de consultas, uma vez que as consultas são executadas di-retamente nos servidores.

( ) Certo   ( ) Errado

7. (2018 – CESPE – EBSERH – Técnico em In-formática)

Julgue o item seguinte, a respeito de banco de dados distribuído e orientado a objetos. Uma das desvantagens dos bancos de da-dos distribuídos é o fato de tornar complexa a atividade de desenvolvimento e a manu-tenção de aplicações, já que os dados estão distribuídos geograficamente em vários ser-vidores.

( ) Certo   ( ) Errado

8. (2018 – CESPE – EBSERH – Técnico em In-formática)

Julgue o item seguinte, a respeito de banco de dados distribuído e orientado a objetos. Em comparação ao banco de dados distri-buído, o banco de dados orientado a obje-tos é mais rápido para algumas tarefas pré--planejadas de recuperação de dados, pois utiliza a recuperação de objetos embasada em ponteiros.

( ) Certo   ( ) Errado

9. (2018 – CESPE – EBSERH – Técnico em In-formática)

Julgue o item seguinte, a respeito de banco de dados distribuído e orientado a objetos. Os sistemas de banco de dados orientado a objeto são compatíveis com a linguagem Java, sendo as conversões necessárias rea-lizadas, de forma automática, pelo software do sistema gerenciador de banco de dados.

( ) Certo   ( ) Errado

10. (2018 – CESPE – STJ – Técnico Judiciário – Suporte Técnico)

Acerca de banco de dados, julgue o item que se segue. Em um diagrama MER, a en-tidade representa uma coisa concreta do mundo real, enquanto as coisas abstratas são representadas pelo relacionamento en-tre as entidades.

( ) Certo   ( ) Errado

11. (2018 – CESPE – STJ – Técnico Judiciário – Suporte Técnico)

Acerca de banco de dados, julgue o item que se segue. Na criação de uma tabela para os clientes de uma organização, os atri-butos de CPF e CNPJ, para pessoas físicas e jurídicas, respectivamente, são a escolha mais indicada para representar a chave pri-mária (PK) da tabela.

( ) Certo   ( ) Errado

12. (2018 – CESPE – ABIN – Oficial Técnico de Inteligência – Área 8)

A respeito de sistemas gerenciadores de banco de dados, julgue o próximo item. Chave primária é o conjunto de um ou mais atributos para identificar uma tupla de uma entidade.

( ) Certo   ( ) Errado

Page 33: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br 33

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

13. (2018 – CESPE – STM – Técnico Judiciário – Programação de Sistemas)

Acerca dos conceitos de normalização de dados e dos modelos de dados, julgue o item subsequente. Uma tabela estará na segunda forma normal (2FN) quando, além de estar na terceira forma normal (3FN), ela contiver dependências funcionais parciais.

( ) Certo   ( ) Errado

14. (2018 – CESPE – STM – Técnico Judiciário – Programação de Sistemas)

Acerca dos conceitos de normalização de dados e dos modelos de dados, julgue o item subsequente. O modelo conceitual, que reflete uma estrutura simplificada do banco de dados, é responsável por registrar como os dados estão armazenados no sis-tema de gerenciamento de banco de dados (SGBD).

( ) Certo   ( ) Errado

15. (2018 – CESPE – STM – Técnico Judiciário – Programação de Sistemas)

Acerca dos conceitos de normalização de dados e dos modelos de dados, julgue o item subsequente. Comparativamente aos usados pelos usuários leigos, os modelos de dados utilizados por programadores são considerados menos abstratos, pois contêm mais detalhes de como as informações es-tão organizadas internamente no banco de dados.

( ) Certo   ( ) Errado

Gabarito: 1. Errado 2. Certo 3. Errado 4. Errado 5. Certo 6. Errado 7. Errado 8. Certo 9. Certo 10. Errado  11. Errado 12. Certo 13. Errado 14. Errado 15. Certo

Page 34: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

34 www.acasadoconcurseiro.com.br

DATA MINING

Data Warehouse

Executivos tomadores de decisão (diretores, gerentes, analistas, etc.) necessitam de ferramentas de apoio a tomada de decisão. É aí que entram os sistemas de suporte à decisão (Decision Support Systems – DSS), ferramentas que ofereçam consultas sob demanda, interfaces gráficas, etc.

Um data warehouse visa integrar os dados internos e externos de uma organização em uma estrutura unificada, a fim de permitir uma melhor utilização dos dados.

A partir de uma estrutura de DW obtida, a análise destes dados se dá através de sistemas como OLAP (Online Analytical Processing) e data mining.

Um data warehouse é uma coleção de dados orientada por assuntos, integrada, variante no tempo, que tem por objetivo dar suporte aos processos de tomada de decisão.

O data warehouse é um banco de dados contendo dados extraídos do ambiente de produção da empresa (OLTP), que foram selecionados, tendo sido otimizados para processamento de consulta e não para processamento de transações através de um processo de extração transformação e carga (ou ETL – Extract transform and Load).

De maneira geral, um data warehouse pode consolidar dados de outras fontes externas, incluindo informações provenientes de planilhas eletrônicas, documentos, dados da web, etc.

O objetivo de um data warehouse é fornecer uma imagem única da realidade do negócio. De uma forma geral, sistemas de data warehouse compreendem um conjunto de programas que extraem dados do ambiente de dados operacionais da empresa, um banco de dados que os mantém, e sistemas que fornecem estes dados aos seus usuários.

Sistemas de Data Warehouse revitalizam os sistemas da empresa, pois:

• permitem que sistemas mais antigos continuem em operação; • consolidam dados inconsistentes dos sistemas mais antigos em conjuntos coerentes; • extraem benefícios de novas informações oriundas das operações correntes;

Como se vê, existem diferentes visões do que seria um data warehouse: uma arquitetura, um conjunto de dados semanticamente consistente com o objetivo de atender diferentes necessidades de acesso a dados e extração de relatórios, ou ainda, um processo em constante evolução, que utiliza dados de diversas fontes heterogêneas para dar suporte a consultas ad-hoc (sob demanda), relatórios analíticos e à tomada de decisão.

Page 35: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

35www.acasadoconcurseiro.com.br

Figura 1 – Representação do ambiente DW

Propósitos de um Data Wharehouse

Para entender o propósito do DW, analisaremos as seguintes questões:

“Nós possuímos montanhas de dados, no entanto, não conseguimos acessá-los.”

“É necessário facilitar o acesso às informações para os usuários de negócio.”

“Apenas mostre-me o que é importante.”

“Nós precisamos que as pessoas usem a informação para suportar uma tomada de decisão baseada em fatos.”

Uma das missões do data Warehouse é justamente consolidar os dados que são importantes para a tomada de decisão. Evitar o “Achômetro”.

Extraindo informações do Data Warehouse

Existem várias maneiras de recuperar informações de um data warehouse, as formas de extração mais comuns no mercado hoje são:

• Reporting – Ferramentas de consulta e emissão de relatórios • Analytics – Ferramentas OLAP (Online Analytical Processing) • Data mining

Page 36: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

36 www.acasadoconcurseiro.com.br

Ferramentas de Data Mining

Data mining (ou mineração de dados) é o processo de extrair informação válida, previamente desconhecida e de máxima abrangência a partir de grandes bases de dados, usando-as para apoiar nas tomadas de decisões.

Data mining vai muito além da simples consulta a um banco de dados, no sentido de que permite aos usuários explorar e inferir informação útil a partir dos dados, descobrindo relacionamentos escondidos no banco de dados.

Pode ser considerada uma forma de descobrimento de conhecimento em bancos de dados (KDD – Knowledge Discovery in Databases).

Um ambiente de apoio à tomada de decisões, integrando técnicas de data mining sobre um ambiente de data warehousing, possibilita um grande número de aplicações, que já vêm sendo implementadas em diversos segmentos de negócios, como manufatura, automação de pedido de remessas, varejo, gerenciamento de inventários, financeiro, análise de risco, transporte, gerenciamento de frotas, telecomunicação, análise de chamadas, saúde, analise de resultados, marketing, estabelecimento do perfil dos consumidores, seguros, detecção de fraude, dentre outros.

Basicamente, são usados três métodos para identificar padrões em dados:

• Modelos simples (consultas baseadas em SQL, raciocínio humano) • Modelos intermediários (regressão, árvores de decisão, agrupamento) • Modelos complexos (redes neurais, outra indução de regras)

A mineração de dados é formada por um conjunto de ferramentas e técnicas que através do uso de algoritmos de aprendizagem ou classificação baseados em redes neurais e estatística, são capazes de explorar um conjunto de dados, extraindo ou ajudando a evidenciar padrões nestes dados e auxiliando na descoberta de conhecimento. Esse conhecimento pode ser apresentado por essas ferramentas de diversas formas: agrupamentos, hipóteses, regras, árvores de decisão, grafos ou dendrogramas.

O ser humano sempre aprendeu observando padrões, formulando hipóteses e testando-as para descobrir regras. A novidade da era do computador é o volume enorme de dados que não pode mais ser examinado à procura de padrões em um prazo razoável. A solução é instrumentalizar o próprio computador para detectar relações que sejam novas e úteis. A mineração de dados (MD) surge para essa finalidade e pode ser aplicada tanto para a pesquisa científica como para impulsionar a lucratividade da empresa madura, inovadora e competitiva. Também a multidisciplinaridade da mineração de dados pode ser considerada inevitável devido à integração de diversas áreas de conhecimento no processo de análise, abordando áreas de pesquisas que envolvem estatística, matemática e a computação, as quais são disciplinas fundamentais para realização do processo de mineração de dados.

Diariamente as empresas acumulam grande volume de dados em seus aplicativos operacionais. São dados brutos que dizem quem comprou o quê, onde, quando e em que quantidade. É a informação vital para o dia-a-dia da empresa. Se fizermos estatística ao final do dia para repor estoques e detectar tendências de compra, estaremos praticando business intelligence (BI). Se analisarmos os dados com estatística de modo mais refinado, à procura de padrões

Page 37: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

37www.acasadoconcurseiro.com.br

de vinculações entre as variáveis registradas, então estaremos fazendo mineração de dados. Buscamos com a MD conhecer melhor os clientes, seus padrões de consumo e motivações. A MD resgata em organizações grandes o papel do dono atendendo no balcão e conhecendo sua clientela. Através da MD, esses dados agora podem agregar valor às decisões da empresa, sugerir tendências, desvendar particularidades dela e de seu meio ambiente e permitir ações melhor informadas aos seus gestores.

Pode-se então diferenciar o business intelligence (BI) da mineração de dados (MD) como dois patamares distintos de atuação. O primeiro busca subsidiar a empresa com conhecimento novo e útil acerca do seu meio ambiente e funciona no plano estratégico. O Segundo visa obter a partir dos dados operativos brutos, informação útil para subsidiar a tomada de decisão nos escalões médios e altos da empresa e funciona no plano tático.

Dentre as etapas mais importantes do Data Mining, podemos elencar as seguintes:

Análise do problema – O processo de análise inicia a partir de um objetivo de busca, seguindo um determinado conhecimento; o principal objetivo é a possibilidade de selecionar os dados e definir as técnicas utilizadas na análise. De acordo com o CRISP-DM (Cross-Industry Standard Process for Data Mining) essa fase pode ser dividida em Entendimento do Negócio e Entendimento dos Dados.

Preparação dos Dados – A preparação consiste em fases internas de coletânea de dados, avaliação, consolidação e limpeza, seleção dos dados e transformação.

Coletânea de dados: Dados provindos de diversas fontes internas ou externas, como por exemplo de cartão de crédito;

Avaliação: Exame sobre os dados colhidos com o objetivo de identificar características do modelo da cada informação.

Consolidação e limpeza: Construção de base de dados a partir de correções de erros, remoção de registros e inserção de valores comuns em campos vazios.

Seleção de dados: É a seleção de dados específicos para cada modelo de dado, como a seleção de variáveis em colunas ou dependentes.

Transformação: Ferramenta escolhida para redirecionar a apresentação dos dados.

Modelagem – Definição de tarefas e técnicas utilizadas sobre a ação de cada algoritmo, etapa que gera um modelo a ser analisado posteriormente.

Análise e validação de resultados – Considerando que um modelo válido nem sempre é um modelo correto, visa detectar o que há de implícito num modelo, e o que nele é mais peculiar na precisão de uma informação.

Page 38: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento
Page 39: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br 39

Questões

1. (2018 – CESPE – EBSERH – Analista de Tec-nologia da Informação)

Julgue o item que se segue, a respeito de arquitetura e tecnologias de sistemas de in-formação. A descoberta de novas regras e padrões em conjuntos de dados fornecidos, ou aquisição de conhecimento indutivo, é um dos objetivos de data mining.

( ) Certo   ( ) Errado

2. (2018 – CESPE – STJ – Técnico Judiciário – Desenvolvimento de Sistemas)

Julgue o item que se segue, acerca de data mining e data warehouse. O processo de mineração de dados está intrinsecamente ligado às dimensões e a fato, tendo em vis-ta que, para a obtenção de padrões úteis e relevantes, é necessário que esse processo seja executado dentro dos data warehou-ses.

( ) Certo   ( ) Errado

3. (2018 – CESPE – STJ – Analista Judiciário – Psicologia)

Considerando que, com a iminente aposen-tadoria de grande parcela dos servidores de determinado órgão público e a consequen-te perda de conhecimentos organizacionais estrategicamente imprescindíveis, o setor competente tenha decidido pela implan-tação de uma política de gestão do conhe-cimento, julgue o item a seguir. A fim de promover a captura, o compartilhamento e a aquisição do conhecimento, a política de gestão do conhecimento do órgão pode-rá dispor, respectivamente, das práticas de data mining, wikis e treinamentos baseados em tecnologia web.

( ) Certo   ( ) Errado

4. (2016 – CESPE – FUNPRESP-JUD – Analista – Tecnologia da Informação)

Julgue o item subsecutivo, referente às tecnologias de bancos de dados. Em Data-Mining, as árvores de decisão podem ser usadas com sistemas de classificação para atribuir informação de tipo.

( ) Certo   ( ) Errado

5. (2016 – CESPE – TCE-PA – Auditor de Con-trole Externo – Área Informática – Analista de Sistema)

Julgue o item a seguir, em relação a data warehouse e data mining. No contexto de data mining, o processo de descoberta de conhecimento em base de dados consiste na extração não trivial de conhecimento previamente desconhecido e potencialmen-te útil.

( ) Certo   ( ) Errado

6. (2016 – CESPE – TCE-SC – Auditor Fiscal de Controle Externo – Informática)

Julgue o item subsecutivo, acerca de mine-ração de dados. Para a realização de prog-nósticos por meio de técnicas de mineração de dados, parte-se de uma série de valores existentes obtidos de dados históricos bem como de suposições controladas a respeito das condições futuras, para prever outros valores e situações que ocorrerão e, assim, planejar e preparar as ações organizacio-nais.

( ) Certo   ( ) Errado

Page 40: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br40

7. (2016 – CESPE – TCE-SC – Auditor Fiscal de Controle Externo – Informática)

Julgue o item subsecutivo, acerca de mine-ração de dados. As aglomerações, tipos de informação obtidos por meio da mineração de dados, caracterizam-se por se ligarem a um único e específico evento, em torno do qual ocorrem várias ações, com produção sistêmica de informações gerenciais que apoiarão uma nova ocorrência do mesmo tipo de evento.

( ) Certo   ( ) Errado

8. (2016 – CESPE – TRT – 8ª Região (PA e AP) – Analista Judiciário – Tecnologia da Infor-mação)

Acerca de data mining, assinale a opção cor-reta.

a) A fase de preparação para implementa-ção de um projeto de data mining con-siste, entre outras tarefas, em coletar os dados que serão garimpados, que de-vem estar exclusivamente em um data warehouse interno da empresa.

b) As redes neurais são um recurso mate-mático/computacional usado na apli-cação de técnicas estatísticas nos pro-cessos de data mining e consistem em utilizar uma massa de dados para criar e organizar regras de classificação e deci-são em formato de diagrama de árvore, que vão classificar seu comportamento ou estimar resultados futuros.

c) As aplicações de data mining utilizam diversas técnicas de natureza estatísti-ca, como a análise de conglomerados (cluster analysis), que tem como obje-tivo agrupar, em diferentes conjuntos de dados, os elementos identificados como semelhantes entre si, com base nas características analisadas.

d) As séries temporais correspondem a técnicas estatísticas utilizadas no cálcu-lo de previsão de um conjunto de infor-mações, analisando-se seus valores ao longo de determinado período. Nesse

caso, para se obter uma previsão mais precisa, devem ser descartadas eventu-ais sazonalidades no conjunto de infor-mações.

e) Os processos de data mining e OLAP têm os mesmos objetivos: trabalhar os dados existentes no data warehouse e realizar inferências, buscando reconhe-cer correlações não explícitas nos dados do data warehouse.

Explicação:

a) A fase de preparação para implementa-ção de um projeto de data mining consiste, entre outras tarefas, em coletar os dados que serão garimpados, que podem não es-tar exclusivamente em um data warehouse interno da empresa.

b) As árvores de decisão são um recurso matemático/computacional usado na apli-cação de técnicas estatísticas nos processos de data mining e consistem em utilizar uma massa de dados para criar e organizar re-gras de classificação e decisão em formato de diagrama de árvore, que vão classificar seu comportamento ou estimar resultados futuros.

d) ... devem ser considerados eventuais sa-zonalidades.

e) essa definição vale somente para data mining.

9. (2016 – CESPE – FUNPRESP-EXE – Especia-lista – Tecnologia da Informação)

Com relação à forma como os dados são armazenados e manipulados no desenvolvi-mento de aplicações, julgue o item a seguir. Na implementação de mineração de dados (data mining), a utilização da técnica de pa-drões sequenciais pode ser útil para a iden-tificação de tendências.

( ) Certo   ( ) Errado

Page 41: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br 41

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

10. (2015 – CESPE – MEC – Administrador de Dados)

Acerca de data warehouse (DW), Business Intelligence (BI) e data mining, julgue o item que se segue. Situação hipotética: Após o período de inscrição para o vestibular de determinada universidade pública, foram reunidas informações acerca do perfil dos candidatos, cursos inscritos e concorrên-cias. Ademais, que, por meio das soluções de BI e DW que integram outros sistemas, foram realizadas análises para a detecção de relacionamentos sistemáticos entre as informações registradas. Assertiva: Nessa situação, tais análises podem ser considera-das como data mining, pois agregam valor às decisões do MEC e sugerem tendências, como, por exemplo, o aumento no número de escolas privadas e a escolha de determi-nado curso superior.

( ) Certo   ( ) Errado

Gabarito: 1. Certo 2. Errado 3. Certo 4. Certo 5. Certo 6. Certo 7. Errado 8. C 9. Errado 10. Certo

Page 42: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

42 www.acasadoconcurseiro.com.br

NOÇÕES DE ALGORITMOS DE APRENDIZADO

O aprendizado automático, aprendizado de máquina (em inglês: “machine learning”) ou aprendizagem automática é um subcampo da ciência da computação que evoluiu do estudo de reconhecimento de padrões e da teoria do aprendizado computacional em inteligência artificial. Em 1959, Arthur Samuel definiu aprendizado de máquina como o “campo de estudo que dá aos computadores a habilidade de aprender sem serem explicitamente programados”(livre tradução). O aprendizado automático explora o estudo e construção de algoritmos que podem aprender de seus erros e fazer previsões sobre dados. Tais algoritmos operam construindo um modelo a partir de inputs amostrais a fim de fazer previsões ou decisões guiadas pelos dados ao invés de simplesmente seguindo inflexíveis e estáticas instruções programadas. Enquanto que na inteligência artificial existem dois tipos de raciocínio (o indutivo, que extrai regras e padrões de grandes conjuntos de dados, e o dedutivo), o aprendizado de máquina só se preocupa com o indutivo.

Algumas partes do aprendizado automático estão intimamente ligadas (e muitas vezes sobrepostas) à estatística computacional; uma disciplina que foca em como fazer previsões através do uso de computadores, com pesquisas focando nas propriedades dos métodos estatísticos e sua complexidade computacional. Ela tem fortes laços com a otimização matemática, que produz métodos, teoria e domínios de aplicação para este campo. O aprendizado automático é usado em uma variedade de tarefas computacionais onde criar e programar algoritmos explícitos é impraticável. Exemplos de aplicações incluem filtragem de spam, reconhecimento ótico de caracteres (OCR), processamento de linguagem natural, motores de busca, diagnósticos médicos, bioinformática, reconhecimento de fala, reconhecimento de escrita, visão computacional e locomoção de robôs. O aprendizado de máquinas é às vezes confundido com mineração de dados, que é um subcampo que foca mais em análise exploratória de dados e é conhecido como aprendizado não supervisionado. No campo da análise de dados, o aprendizado de máquinas é um método usado para planejar modelos complexos e algoritmos que se prestam para fazer predições no uso comercial, isso é conhecido como análise preditiva. Esses modelos analíticos permitem que pesquisadores, cientistas de dados, engenheiros, e analistas possam “produzir decisões e resultados confiáveis e repetitíveis” e descobrir os “insights escondidos” através do aprendizado das relações e tendências históricas nos dados.

Os algoritmos de aprendizado são classificados em três categorias: “Supervisionados”, “Não supervisionados” e “Por reforço”. Este último não está no nosso edital.

Page 43: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

43www.acasadoconcurseiro.com.br

Características dos Algoritmos Supervisionados

• Utilizados para fazer CLASSIFICAÇÃO (com rótulos definidos) ou para fazer REGRESSÃO (prever valores).

Classificação: Quando os dados estiverem sendo usados para prever uma categoria, o aprendizado supervisionado também será chamado de classificação. Esse é o caso ao atribuir uma imagem como uma foto de um ‘gato’ ou de um ‘cachorro’. Quando há apenas duas opções, isso é chamado de classificação binomial ou de duas classes. Quando houver mais categorias, como na previsão do vencedor do torneio, esse problema é conhecido como classificação multiclasse.

Regressão: Utilizado quando um valor estiver sendo previsto, assim como acontece com preços de cotações

• Conhecemos todas as características e podemos registrar elas em um banco de dados, normalmente uma tabela.

• Prever uma variável dependente a partir de uma lista de variáveis independentes.

• Exemplos: Com os dados da primeira coluna podemos prever os dados da segunda coluna

Dados que temos Dados que podem ser previstos

Anos de Carreira, Formação e Idade Salário

Idade do Carro e Idade do Motorista Risco de Acidente

N características de vinho Tipo de vinho

N características da Flor Iris Tipo de flor (virgínica, versicolor, setosa)

Abaixo um exemplo de informações sobre a flor Iris. As 4 últimas informações são coletadas e se consegue classificar o tipo de flor (coluna D).

Exemplo de tabela a ser utilizada para Classificação da Flor de Iris

Outra utilização muito importante de algoritmo é a Regressão. Neste caso se tem um valor e se busca outro. No exemplo abaixo, temos a distância percorrida e conseguimos estimar o VO2 (quantidade de oxigênio que o atleta consegue produzir).

Page 44: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

44 www.acasadoconcurseiro.com.br

Ferramentas utilizadas para Algoritmos Supervisionados

• KNN (k-Nearest Neighbors) ou k-vizinhos mais próximos – Ferramenta mais utilizada do mercado.

• Distance-Weighted Nearest Neighbors – Criado a partir do KNN com foco em cálculos de distância.

• SVM (Support Vector Machines) ou Máquinas de vetores de suporte – Conjunto relacionado de métodos de aprendizado supervisionado usados para classificação e regressão. Dado um conjunto de exemplos de treinamento, cada um marcado como pertencente de uma ou duas categorias, um algoritmo SVM constrói um modelo que prediz se um novo exemplo cai dentro de uma categoria ou outra. Estuda e analisa dados com o objetivo de reconhecimento de padrões.

• Técnicas utilizadas: Redes Neurais, Árvores de decisão e Regressão.

Características dos Algoritmos Não Supervisionados

• No aprendizado não supervisionado, os pontos de dados não têm rótulos associados a eles. Em vez disso, a meta de um algoritmo de aprendizado sem supervisão é organizar os dados de alguma forma ou descrever sua estrutura. Isso pode significar fazer um AGRUPAMENTO em clusters ou encontrar diferentes maneiras de consultar dados complexos para que eles pareçam mais simples ou mais organizados.

• Objetivo é montar a ESTRUTURA do conjunto de dados.

• Não conhecemos todas as características e não podemos registrar.

• Exemplos: Com os dados da primeira coluna podemos prever os dados da segunda coluna

Page 45: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

45www.acasadoconcurseiro.com.br

Dados que temos Dados que podem ser previstos

Registro das vendas “Associação entre os produtos” ou “Perfil do Comprador”

Transações bancárias Definir legalidade / normalidade da transação

Palavras de um livro Definir o perfil do livro

Gráfico característico de análise de algoritmos não supervisionados

Ferramentas utilizadas para Algoritmos Não Supervisionados

• K-means ou K-médias – é um dos mais simples e os mais conhecidos algoritmos de aprendizado não supervisionado, e pode ser usado para uma variedade de aprendizagem de tarefas, tais como a detecção de dados anormais.

• Técnicas:

• Redes neurais artificiais • Expectativa-Maximização • Clusterização

Page 46: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento
Page 47: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br 47

Questões

1. (2018 – CESGRANRIO – Petrobras – Analista de Sistemas Júnior – Processos de Negócio)

Dois funcionários de uma empresa de cré-dito discutiam sobre quais algoritmos de-veriam usar para ajudar a classificar seus clientes como bons ou maus pagadores. A empresa possui, para todos os emprésti-mos feitos no passado, um registro forma-do pelo conjunto de informações pessoais sobre o cliente e de como era composta a dívida inicial. Todos esses registros tinham classificações de bons ou maus pagadores, de acordo com o perfil de pagamento dos clientes. A partir desses dados, os funcioná-rios querem construir um modelo, por meio de aprendizado de máquina, que classifique os novos clientes, que serão descritos por registros com o mesmo formato. A melhor opção, nesse caso, é usar um algoritmo

a) supervisionado, como SVM b) supervisionado, como K-means c) não supervisionado, como regressão li-

neard) não supervisionado, como árvores de

decisão e) semi-supervisionado, como redes baye-

sianas

2. (2018 – CESPE – TCM-BA – Auditor Estadual de Controle Externo)

A respeito das técnicas e(ou) métodos de mi-neração de dados, assinale a opção correta.

a) O agrupamento (ou clustering) realiza identificação de grupos de dados que apresentam coocorrência.

b) A classificação realiza o aprendizado de uma função que pode ser usada para mapear os valores associados aos da-dos em um ou mais valores reais.

c) A regressão ou predição promove o aprendizado de uma função que pode ser usada para mapear dados em uma de várias classes discretas definidas previamente, bem como encontrar ten-dências que possam ser usadas para en-tender e explorar padrões de compor-tamento dos dados.

d) As regras de associação identificam grupos de dados, em que os dados têm características semelhantes aos do mesmo grupo e os grupos têm caracte-rísticas diferentes entre si.

e) Os métodos de classificação supervisio-nada podem ser embasados em separa-bilidade (entropia), utilizando árvores de decisão e variantes, e em particiona-mento, utilizando SVM (support vector machines).

3. (2018 – CESGRANRIO – Banco do Brasil – Prova: Escriturário)

Um desenvolvedor de uma instituição ban-cária foi designado para tentar usar técnicas de aprendizado de máquina para, dado o saldo diário durante um ano de um cliente, classificá-lo como BOM ou MAU candida-to a receber um cartão de crédito VIP. Para isso, a única informação que pode usar — e que ele recebeu — é um conjunto de trei-namento com 50.000 clientes pré-classifi-cados pelos seus gerentes, contendo 365 campos com os saldos diários e um campo com o número 1, caso o cliente fosse um BOM candidato, ou o número 0 (zero), caso fosse um MAU candidato. Essas respostas são consideradas corretas. Considerando as práticas tradicionais de aprendizado de má-quina, o desenvolvedor deve escolher um algoritmo

Page 48: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br48

a) supervisionado, porque humanos preci-sarão verificar a execução do algoritmo.

b) supervisionado, porque o conjunto de treinamento possui dados e rótulo, sen-do necessário aprender a função que prediz o rótulo correto.

c) não supervisionado, porque humanos não precisarão verificar a execução do algoritmo.

d) não supervisionado, porque o conjunto de treinamento possui dados e rótulo, sendo necessário aprender a função que prediz o rótulo correto.

e) não supervisionado, porque, no futuro, os rótulos não estarão disponíveis.

Gabarito: 1. A 2. E 3. B

Page 49: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

49www.acasadoconcurseiro.com.br

BIG DATA

O termo Big Data refere-se a um grande conjunto de dados armazenados e baseia-se em 5 V’s: velocidade, volume, variedade, veracidade e valor.

Big Data é um termo amplamente utilizado na atualida-de para nomear conjuntos de dados muito grandes ou complexos, que os aplicativos de processamento de da-dos tradicionais ainda não conseguem lidar. Os desafios desta área incluem: análise, captura, curadoria de dados, pesquisa, compartilhamento, armazenamento, transfe-rência, visualização e informações sobre privacidade dos dados. Este termo muitas vezes se refere ao uso de análi-se preditiva e de alguns outros métodos avançados para extrair valor de dados, e raramente a um determinado tamanho do conjunto de dados. Maior precisão nos dados pode levar à tomada de decisões com mais con-fiança. Além disso, melhores decisões podem significar maior eficiência operacional, redução de risco e redução de custos.

Volume

Big Data é uma grande quantidade de dados gerada a cada segundo. Pense em todos os e-mails, mensagens de Twitter, fotos e vídeos que circulam na rede a cada instante. Não são terabytes e sim zetabytes e brontobytes. Só no Facebook são 10 bilhões de mensagens, 4,5 bilhões de curtidas e 350 milhões de fotos compartilhadas todos os dias. A tecnologia do Big Data serve exatamente para lidar com esse volume de dados, guardando-os em diferentes localidades e juntando-os através de software.

Velocidade

Se refere à velocidade com que os dados são criados. São mensagens de redes sociais se “viralizando” em segundos, transações de cartão de crédito sendo verificadas a cada instante ou os milissegundos necessários para calcular o valor de compra e venda de ações. O Big Data serve para analisar os dados no instante em que são criados, sem ter de armazená-los em bancos de dados.

Variedade

No passado, a maior parte dos dados era estruturada e podia ser colocada em tabelas e relações. Hoje, 80% dos dados do mundo não se comportam dessa forma. Com o Big Data, mensagens, fotos, vídeos e sons, que são dados não-estruturados, podem ser administrados juntamente com dados tradicionais.

Page 50: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

50 www.acasadoconcurseiro.com.br

Veracidade

Um dos pontos mais importantes de qualquer informação é que ela seja verdadeira. Com o Big Data não é possível controlar cada hashtag do Twitter ou notícia falsa na internet, mas com análises e estatísticas de grandes volumes de dados é possível compensar as informações incorretas.

Valor

O último V é o que torna Big Data relevante: tudo bem ter acesso a uma quantidade massiva de informação a cada segundo, mas isso não adianta nada se não puder gerar valor. É importante que empresas entrem no negócio do Big Data, mas é sempre importante lembrar dos custos e benefícios e tentar agregar valor ao que se está fazendo.

Hadoop

Hadoop é uma plataforma de software em Java de computação distribuída voltada para clusters e processamento de grandes volumes de dados, com atenção a tolerância a falhas. Foi inspirada no MapReduce e no GoogleFS (GFS). Trata-se de um projeto da Apache de alto nível, construído por uma comunidade de colaboradores e utilizando a linguagem de programação Java. O Yahoo! tem sido o maior colaborador do projeto, utilizando essa plataforma intensivamente em seus negócios. É disponibilizado pela Amazon e IBM em suas plataformas.

Componentes

O framework do Apache Hadoop é composto dos módulos seguintes na versão 2:

Hadoop Common – Contém as bibliotecas e arquivos comuns e necessários para todos os módulos Hadoop.

Hadoop Distributed File System (HDFS) – Sistema de arquivos distribuído que armazena dados em máquinas dentro do cluster, sob demanda, permitindo uma largura de banda muito grande em todo o cluster.

Hadoop Yarn – Trata-se de uma plataforma de gerenciamento de recursos responsável pelo gerenciamento dos recursos computacionais em cluster, assim como pelo agendamento dos recursos.

Hadoop MapReduce – Modelo de programação para processamento em larga escala.

Page 51: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

51www.acasadoconcurseiro.com.br

Todos os módulos do Hadoop são desenhados com a premissa fundamental de que falhas em hardware são comuns, sejam elas máquinas individuais ou um conjunto inteiro de máquinas em racks, e devem, portanto, ser automaticamente tratadas pelo software do framework.

A solução Hadoop é formada por diversos outros componentes que agregam funções específicas ou alternativas para componentes nativos do Hadoop. A esse conjunto de aplicação dá-se o nome de Ecossistema Hadoop.

O HDFS é composto por clusters de computadores interconectados onde os arquivos e diretórios residem. Um cluster HDFS consiste em um único nó, conhecido como um Name Node, que gerencia o sistema de arquivos e regula o acesso do cliente aos arquivos. Além disso, os nós de dados (Data Nodes) armazenam dados como blocos dentro dos arquivos.

Dentro do HDFS, um Node Name gerencia operações do sistema de arquivos do tipo abrir, fechar e renomear arquivos e diretórios. Um Node Name também mapeia blocos de dados para os Data Nodes, os quais gerenciam as solicitações de leitura e gravação dos clientes HDFS. Os Data Nodes também criam, excluem e replicam blocos de dados de acordo com as instruções do nó de Name Node.

Page 52: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento
Page 53: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br 53

Questões

1. (2018 – CESPE – EBSERH – Analista de Tecnologia da Informação)

Com relação a banco de dados, julgue o item seguinte. As soluções de big data fo-calizam dados que já existem, descartam dados não estruturados e disponibilizam os dados estruturados.

( ) Certo   ( ) Errado

2. (2018 – CESPE – TCM-BA – Auditor Estadual de Controle Externo)

Acerca de big data, assinale a opção correta.

a) A utilização de big data nas organiza-ções não é capaz de transformar os seus processos de gestão e cultura.

b) Sistemas de recomendação são méto-dos baseados em computação distribu-ída, que proveem uma interface para programação de clusters, a fim de reco-mendar os tipos certos de dados e pro-cessar grandes volumes de dados.

c) Pode-se recorrer a software conhecidos como scrapers para coletar automati-camente e visualizar dados que se en-contram disponíveis em sítios de nave-gabilidade ruim ou em bancos de dados difíceis de manipular.

d) As ações inerentes ao processo de pre-paração de dados incluem detecção de anomalias, deduplicação, desambigua-ção de entradas e mineração de dados.

e) O termo big data se baseia em cinco Vs: velocidade, virtuosidade, volume, van-tagem e valor.

3. (2018 – CESPE – TCE-PB – Auditor de Con-tas Públicas – Demais Áreas)

Com referência a big data, assinale a opção correta.

a) A definição mais ampla de big data res-tringe o termo a duas partes — o volu-me absoluto e a velocidade —, o que fa-cilita a extração das informações e dos insights de negócios.

b) O sistema de arquivos distribuído Hado-op implementa o algoritmo Dijkstra mo-dificado para busca irrestrita de dados em árvores aglomeradas em clusters com criptografia.

c) Em big data, o sistema de arquivos HDFS é usado para armazenar arquivos muito grandes de forma distribuída, tendo como princípio o write-many, re-ad-once.

d) Para armazenar e recuperar grande vo-lume de dados, o big data utiliza bancos SQL nativos, que são bancos de dados que podem estar configurados em qua-tro tipos diferentes de armazenamen-tos: valor chave, colunar, gráfico ou do-cumento.

e) O MapReduce é considerado um mode-lo de programação que permite o pro-cessamento de dados massivos em um algoritmo paralelo e distribuído.

4. (2018 – CESPE – ABIN – Oficial de Inteligên-cia – Área 4)

Acerca de inteligência cibernética, julgue o item a seguir. O registro e a análise de con-juntos de dados referentes a eventos de segurança da informação são úteis para a identificação de anomalias; esse tipo de re-curso pode ser provido com uma solução de big data.

( ) Certo   ( ) Errado

Page 54: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br54

5. (2018 – CESPE – CGM de João Pessoa – PB – Auditor Municipal de Controle Interno – Desenvolvimento de Sistemas)

A respeito de business intelligence, julgue o próximo item. Situação hipotética: Um órgão público pretende fazer uma análise de big data com o objetivo de realizar mi-neração em grandes conjuntos de dados corporativos para localizar ou encontrar padrões ocultos, o que exigirá uma grande quantidade de processamento. Assertiva: Nesse caso, há necessidade de contratação de um SaaS (software como serviço), que acrescentará uma camada adicional de inte-gração com frameworks de desenvolvimen-to de aplicativos, recursos de middleware e funções como bancos de dados.

( ) Certo   ( ) Errado

6. (2017 – CESPE – TCE-PE – Auditor de Contro-le Externo – Auditoria de Contas Públicas)

Com relação a Big Data, julgue o item subse-quente. Além de estar relacionado à grande quantidade de informações a serem ana-lisadas, o Big Data considera o volume, a velocidade e a variedade dos dados estru-turados — dos quais se conhece a estrutura de armazenamento — bem como dos não estruturados, como imagens, vídeos, áudios e documentos.

( ) Certo   ( ) Errado

7. (2017 – CESPE – TCE-PE – Analista de Contro-le Externo – Auditoria de Contas Públicas)

No que se refere a Big Data, julgue o item subsecutivo. O termo Big Data Analytics re-fere-se aos poderosos softwares que tratam dados estruturados e não estruturados para transformá-los em informações úteis às or-ganizações, permitindo-lhes analisar dados, como registros de call center, postagens de redes sociais, de blogs, dados de CRM e de-monstrativos de resultados.

( ) Certo   ( ) Errado

8. (2016 – CESPE – FUNPRESP-JUD – Analista – Tecnologia da Informação)

A respeito de banco de dados, julgue o pró-ximo item. Uma big data não engloba dados não estruturados, mas inclui um imenso volume de dados estruturados suportado por tecnologias como o DataMining e o Da-taWarehouse para a obtenção de conheci-mento a partir da manipulação desses da-dos.

( ) Certo   ( ) Errado

9. (2018 – CESGRANRIO – Petrobras – Analis-ta de Sistemas Júnior – Processos de Negó-cio)

A principal definição de Big Data parte de três características, conhecidas como 3 V do Big Data, a saber: velocidade, variedade e volume. O termo velocidade refere-se, prin-cipalmente, à

a) necessidade das aplicações de gerar respostas rapidamente, a partir de grandes massas de dados.

b) existência de um alto fluxo de dados na entrada.

c) necessidade de gerar aplicações rapida-mente, em função da demanda do ne-gócio.

d) importância da facilidade de manipular cubos de visualização de dados, rapida-mente.

e) rapidez com que os dados se tornam in-válidos com o tempo.

10. (2018 – CESGRANRIO – Petrobras – Admi-nistrador Júnior)

O termo Big Data é bastante conhecido pe-los profissionais de tecnologia da informa-ção, especialmente aqueles envolvidos com bancos de dados, inteligência de negócios, sistemas de informações e sistemas de apoio à decisão. Uma característica ineren-te a esse conceito é a da

Page 55: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br 55

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

a) complexidade das suas fontes de infor-mação, o que demanda a necessida-de de sua prévia limpeza, integração e transformação.

b) estabilidade da taxa de geração desses dados, o que garante sua utilização con-fiável na geração analítica de informa-ção com independência temporal.

c) heterogeneidade do conjunto de da-dos, empregada em dados originalmen-te estruturados ou semiestruturados.

d) qualidade das fontes de dados, por con-ta dos padrões de expansão e de reten-ção reveladores da ordem existente nos dados.

e) escalabilidade, que, na sua forma origi-nal, possui alto valor granular quando comparado ao de seu volume.

Gabarito: 1. Errado 2. C 3. E 4. Certo 5. Errado 6. Certo 7. Certo 8. Errado 9. B 10. A

Page 56: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

56 www.acasadoconcurseiro.com.br

REDES DE COMUNICAÇÃO E REDES DE COMPUTADORES

Redes de Comunicação concentra as áreas tradicionalmente chamadas de “Redes de Comunicações” e “Redes de Computadores”. A distinção entre estas áreas era mais aparente no passado, no entanto, com o advento da convergência das tecnologias de computação e de comunicação os seus limites se tornarem quase indistintos e uma acaba sobrepondo outra.

Comunicação de Dados

A Comunicação Dados é uma disciplina da área de “Ciências da Computação” que trata da transmissão de informação entre sistemas computacionais e dispositivos diferentes através de um meio de transmissão. A transmissão de informação pressupõe a passagem de sinais através dos meios físicos de comunicação que compõem as redes.

Eficiência na Comunicação

Quando falamos sobre eficiência de um sistema de comunicação de dados, é necessário conhecer 3 fundamentais características: Serviço de Entrega, Confiabilidade e Tempo de Atraso.

• Entrega (ou delivery): Os dados devem ser recebidos somente pelo dispositivo ou usuário de destino, ou seja, o sistema deve entregar os dados ao destino correto;

• Confiabilidade: Dados modificados ou corrompidos em uma transmissão são pouco úteis, portanto, o sistema deve garantir a entrega dos dados;

• Tempo de atraso: Dados entregues tardiamente são pouco úteis. Por exemplo, no caso de transmissões multimídia, como vídeo, os atrasos não são desejáveis, de modo que eles devem ser entregues praticamente no mesmo instante em que foram produzidos, isto é, sem atrasos significativos. Neste caso, o sistema deve entregar dados em um tempo predeterminado e evitar ao máximo os atrasos.

Componentes da Comunicação

Para que a comunicação seja realizada, o processo é composto de elementos básicos, são estes:

• Mensagem: é a informação a ser transmitida. Pode ser constituída de texto, números, figuras, áudio e vídeo – ou qualquer combinação desses;

• Transmissor (TX): é o dispositivo que envia a mensagem de dados. Pode ser um computador, uma estação de trabalho, um telefone, uma câmera de vídeo e assim por diante;

• Receptor (RX): é o dispositivo que recebe a mensagem. Pode ser um computador, uma estação de trabalho, um telefone, uma câmera de vídeo e assim por diante;

Page 57: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

57www.acasadoconcurseiro.com.br

• Meio de Transmissão: é o caminho físico por onde viaja uma mensagem originada e dirigida ao receptor;

• Protocolo: é um conjunto de regras que governa a comunicação de dados. Ele representa um acordo entre os dispositivos que se comunicam.

Transmissão de Dados

A comunicação pode ser realizada de diferentes formas, definindo-se por:

• Sentido da Transmissão (Trocas): Simples, Half-duplex ou Full-duplex.

• Modo de Transmissão (Meio). Trata-se do número de bits enviadas simultaneamente: Paralela ou Serial.

• Sincronização (Tipos). Trata-se da sincronização entre emissor e receptor: Síncrono ou Assíncrono.

Sentido da Transmissão

O sentido de transmissão (ou sentido das trocas) entre dois dispositivos em redes pode acontecer de três maneiras diferentes: Simplex, Half-duplex ou Full-duplex.

• Simplex: A comunicação simplex é aquela em que há somente um transmissor e um receptor. A comunicação é unidirecional, como em uma rua de mão única. Somente um dos dois dispositivos no link é capaz de transmitir, logo o outro só será capaz de receber. Como exemplo temos a transmissão de TV e rádio AM e FM onde apenas podemos receber os dados enviados pelo receptor e não interagimos com o sistema.

• Half-duplex: Neste modo, cada estação pode transmitir e receber, mas nunca ao mesmo tempo. Quando um dispositivo está transmitindo o outro está recebendo e vice-versa. Em uma transmissão half-duplex, toda a capacidade do canal é dada ao dispositivo que estiver transmitindo no momento. Como exemplo temos a comunicação usada por exemplo por um Walk Talking.

• Full-duplex: Neste modo, ambas estações podem transmitir e receber simultaneamente, ou seja, ao mesmo tempo. Sinais em direções opostas compartilham a capacidade do link ou canal. Como exemplo temos a comunicação através de um telefone celular, onde conseguimos falar e ouvir ao mesmo tempo.

Modos de Transmissão

O modo de transmissão designa o número de unidades elementares de informações (bits) que podem ser transmitidas simultaneamente pelo canal de comunicação, ou seja, trata diretamente, a quantidade de bits a ser transmitida ao mesmo tempo.

• Transmissão em modo Paralelo: Na transmissão em modo paralelo, os bits que compõem o carácter são enviados simultaneamente através de várias vias de dados. Uma via é, por exemplo, um fio, um cabo ou qualquer outro suporte físico. A ligação paralela dos computadores de tipo PC necessita geralmente de 10 fios. Exemplos: LPT1, LPT2, IDE, SCSI, PCI.

Page 58: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

58 www.acasadoconcurseiro.com.br

• Transmissão em modo Série: Na transmissão em modo série, os bits que compõem a informação são enviados um a um através de uma única via de dados. Exemplos: USB, Sata (Serial Ata), SaS, PCI-Express.

Quanto a Sincronização

• Transmissão Assíncrona: No modo de transmissão Assíncrono os dados são enviados um a um sem controle de tempo entre um e outro. Cada dado é precedido de uma informação que indica o início da transmissão deste (a informação de início de emissão chama-se bit START) e termina com o envio de uma informação de fim de transmissão (chamada bit STOP, pode eventualmente haver vários bits STOPS). Características: Baixo Rendimento (alto overhead), Fácil Implementação, Baixa Velocidade.

• Transmissão Síncrono: Na transmissão em modo Síncrono os dados são enviados em blocos e em intervalos de tempo definidos, dados de sincronismo são enviados durante a transmissão para manter o sincronismo entre as máquinas. O receptor recebe continuamente (mesmo quando nenhum bit é transmitido) as informações ao ritmo em que o emissor as envia. Características: Boa qualidade de transmissão, Custo de transmissão mais elevado, Equipamento mais sofisticado, Ideal para transmissão de sinais sensíveis a atraso como multimídia (voz, música, vídeo), Transmissão com maior confiabilidade.

Modelo OSI

O Modelo OSI (acrônimo do inglês Open System Interconnection) é um modelo de rede de computador referência da ISO dividido em camadas de funções, criado em 1971 e formalizado em 1983, com objetivo de ser um padrão, para protocolos de comunicação entre os mais diversos sistemas em uma rede local (Ethernet), garantindo a comunicação entre dois sistemas computacionais ponto a ponto.

Este modelo divide as redes de computadores em 7 camadas, de forma a se obter camadas de abstração. Cada protocolo implementa uma funcionalidade assinalada a uma determinada camada.

Segundo Tanenbaum o Modelo OSI não é uma arquitetura de redes, pois não especifica os serviços e protocolos exatos que devem ser usados em cada camada. Ele apenas informa o que cada camada deve fazer.

O Modelo OSI permite comunicação entre máquinas heterogêneas e define diretivas genéricas para a construção de redes de computadores (seja de curta, média ou longa distância) independente da tecnologia utilizada.

Camada 1 – Física

A camada física define especificações elétricas e físicas dos dispositivos. Em especial, define a relação entre um dispositivo e um meio de transmissão, tal como um cabo de cobre ou um cabo de fibra óptica. Isso inclui o layout de pinos, tensões, impedância da linha, especificações do cabo, temporização, hubs, repetidores, adaptadores de rede, adaptadores de barramento

Page 59: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

59www.acasadoconcurseiro.com.br

de host (HBA usado em redes de área de armazenamento) e muito mais. A camada física é responsável por definir se a transmissão pode ser ou não realizada nos dois sentidos simultaneamente. Sendo a camada mais baixa do modelo OSI, diz respeito a transmissão e recepção do fluxo de bits brutos não-estruturados em um meio físico. Ela descreve as interfaces elétricas, ópticas, mecânicas e funcionais para o meio físico e transporta sinais para todas as camadas superiores.

Camada 2 – Ligação de Dados ou Enlace de Dados

A camada de ligação de dados também é conhecida como de enlace ou link de dados. Esta camada detecta e, opcionalmente, corrige erros que possam acontecer no nível físico. É responsável por controlar o fluxo (recepção, delimitação e transmissão de quadros) e também estabelece um protocolo de comunicação entre sistemas diretamente conectados.

Camada 3 – Rede

A camada de rede fornece os meios funcionais e de procedimento de transferência de comprimento variável de dados de sequências de uma fonte de acolhimento de uma rede para um host de destino numa rede diferente (em contraste com a camada de ligação de dados que liga os hosts dentro da mesma rede), enquanto se mantém a qualidade de serviço requerido pela camada de transporte. A camada de rede realiza roteamento de funções, e também pode realizar a fragmentação e remontagem e os erros de entrega de relatório. Roteadores operam nesta camada, enviando dados em toda a rede estendida e tornando a Internet possível. Este é um esquema de endereçamento lógico – os valores são escolhidos pelo engenheiro de rede. O esquema de endereçamento não é hierárquico.

Camada 4 – Transporte

A camada de transporte é responsável por receber os dados enviados pela camada de sessão e segmentá-los para que sejam enviados a camada de rede, que por sua vez, transforma esses segmentos em pacotes. No receptor, a camada de Transporte realiza o processo inverso, ou seja, recebe os pacotes da camada de rede e junta os segmentos para enviar à camada de sessão.

Isso inclui controle de fluxo, ordenação dos pacotes e a correção de erros, tipicamente enviando para o transmissor uma informação de recebimento, garantindo que as mensagens sejam entregues sem erros na sequência, sem perdas e duplicações.

A camada de transporte separa as camadas de nível de aplicação (camadas 5 a 7) das camadas de nível físico (camadas de 1 a 3). A camada 4, Transporte, faz a ligação entre esses dois grupos e determina a classe de serviço necessária como orientada à conexão, com controle de erro e serviço de confirmação ou sem conexões e nem confiabilidade.

O objetivo final da camada de transporte é proporcionar serviço eficiente, confiável e de baixo custo. O hardware e/ou software dentro da camada de transporte e que faz o serviço é denominado entidade de transporte.

Page 60: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

60 www.acasadoconcurseiro.com.br

A ISO define o protocolo de transporte para operar em dois modos: Orientado à conexão e Não-Orientado à conexão. Como exemplo de protocolo orientado à conexão, temos o TCP, e de protocolo não orientado à conexão, temos o UDP que é menos confiável. Ele não garante – entre outras coisas – a entrega, nem tão pouco a ordenação das mesmas. Entretanto, onde o serviço da camada de rede e das outras camadas inferiores é bastante confiável – como em redes locais – o protocolo de transporte não orientado à conexão pode ser utilizado, sem o overhead inerente a uma operação orientada à conexão.

Camada 5 – Sessão

Responsável pela troca de dados e a comunicação entre hosts, a camada de Sessão permite que duas aplicações em computadores diferentes estabeleçam uma comunicação, definindo como será feita a transmissão de dados, pondo marcações nos dados que serão transmitidos. Se porventura a rede falhar, os computadores reiniciam a transmissão dos dados a partir da última marcação recebida pelo computador receptor.

Camada 6 – Apresentação

A camada de Apresentação, também chamada camada de Tradução, converte o formato do dado recebido pela camada de Aplicação em um formato comum a ser usado na transmissão desse dado, ou seja, um formato entendido pelo protocolo usado. Um exemplo comum é a conversão do padrão de caracteres (código de página) quando o dispositivo transmissor usa um padrão diferente do ASCII. Pode ter outros usos, como compressão de dados e criptografia.

Os dados recebidos da camada 7 estão descomprimidos, e a camada 6 do dispositivo transmissor fica responsável por comprimir esses dados. A transmissão dos dados torna-se mais rápida, já que haverá menos dados a serem transmitidos: os dados recebidos da camada 4 foram “encolhidos” e enviados à camada 1.

Para aumentar a segurança, pode-se usar algum esquema de criptografia neste nível, sendo que os dados só serão descodificados na camada 6 do dispositivo receptor.

Ela trabalha transformando os dados em um formato no qual a camada de aplicação possa aceitar, minimizando todo tipo de interferência.

Camada 7 – Aplicação

A camada de aplicação corresponde às aplicações (programas) no topo da camada OSI que serão utilizadas para promover uma interação entre a máquina-usuário (máquina destinatária e o usuário da aplicação). Esta camada também disponibiliza os recursos (protocolo) para que tal comunicação aconteça, por exemplo, ao solicitar a recepção de e-mail através do aplicativo de e-mail, este entrará em contato com a camada de Aplicação do protocolo de rede efetuando tal solicitação (POP3 ou IMAP).

Tudo nesta camada é relacionado ao software. Alguns protocolos utilizados nesta camada são: HTTP, SMTP, FTP, Telnet, SIP, RDP, IRC, SNMP, NNTP, POP3, IMAP, DNS.

Page 61: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

61www.acasadoconcurseiro.com.br

Resumo

Camada Função

Física Transmissão e recepção dos bits brutos através do meio físico de transmissão

Enlace Detecção de erros

Rede Roteamento de pacotes em uma ou várias redes

Transporte Oferece métodos para a entrega de dados ponto-a-ponto

Sessão Negociação e conexão com outros nós, analogia

Apresentação Formatação dos dados, conversão de códigos e caracteres, compressão e cripto-grafia

Aplicação Funções especialistas (transferência de arquivos, envio de e-mail, terminal virtual)

Pilha TCP/IP

O modelo ou arquitetura TCP/IP busca fornecer abstração aos protocolos e serviços para diferentes camadas de uma pilha de estruturas de dados (ou simplesmente pilha).

No caso do modelo inicial do TCP/IP, a pilha possui quatro camadas:

• Camada 1 – Enlace (Interface com Rede) – (1ª e 2ª camada OSI) – Essa é a parte conhecida como física pois trata-se das tecnologias usadas para as conexões como: Ethernet, Wi-Fi, Modem, etc. No modelo OSI, essa camada também é física, porém, é dividido em duas partes: física e enlace de dados. A física é a parte do hardware e a enlace de dados é a parte lógica do hardware, MAC address.

• Camada 2 – Internet – (3ª camada OSI) – O protocolo mais importante é IP. Essa parte é responsável pelas conexões entre as redes locais, estabelecendo assim a interconexão.

• Camada 3 – Transporte – (4ª camada OSI) – Protocolos TCP, UDP. Essa parte controla a comunicação host-a-host.

• Camada 4 – Aplicação – (5ª, 6ª e 7ª camada OSI) – Protocolos HTTP, HTTPS, FTP, DNS. Essa parte contém todos os protocolos para um serviço específico de comunicação de dados em um nível de processo-a-processo (por exemplo: como um navegador deve se comunicar com um servidor da web).

As camadas mais próximas do topo estão logicamente mais perto do usuário, enquanto aquelas mais abaixo estão logicamente mais perto da transmissão física do dado. Cada camada tem um protocolo de camada acima e um protocolo de camada abaixo (exceto as camadas da ponta, obviamente) que podem usar serviços de camadas anteriores ou fornecer um serviço, respectivamente.

Enxergar as camadas como fornecedores ou consumidores de serviço é um método de abstração para isolar protocolos de camadas acima dos pequenos detalhes de transmitir bits através, digamos, de ethernet, e a detecção de colisão enquanto as camadas abaixo evitam ter de conhecer os detalhes de todas as aplicações e seus protocolos.

Page 62: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

62 www.acasadoconcurseiro.com.br

Essa abstração também permite que camadas de cima forneçam serviços que as camadas de baixo não podem fornecer. Por exemplo, o IP é projetado para não ser confiável e é um protocolo best effort delivery. Isso significa que toda a camada de transporte deve indicar se irá ou não fornecer confiabilidade e em qual nível.

O TCP (Transmission Control Protocol – Protocolo de Controle de Transmissão), é um protocolo orientado a conexões confiável que permite a entrega sem erros de um fluxo de bytes.

O UDP fornece integridade de dados (via um checksum) mas não fornece entrega garantida; já o TCP fornece tanto integridade dos dados quanto garantia de entrega (retransmitindo até que o destinatário receba o pacote).

Comparação com o modelo OSI

Existe a discussão de como mapear o mode-lo TCP/IP convencionalmente de 4 camadas dentro do modelo OSI que possui o padrão de 7 camadas, pois os modelos TCP/IP e OSI não combinam exatamente.

Além do mais, o modelo OSI não é realmen-te rico o suficiente nas camadas mais baixas para capturar a verdadeira divisão de cama-das; é necessário uma camada extra (a ca-mada internet) entre as camadas de trans-porte e de rede. Protocolos específicos para um tipo de rede que rodam em cima de estrutura de hardware básica precisam estar na camada de rede. Exemplo desse tipo de protocolo é ARP.

Geralmente, as três camadas mais acima do modelo OSI (aplicação, apresentação e sessão) são consideradas como uma única camada (aplicação) no modelo TCP/IP. Isso porque o TCP/IP tem uma camada de sessão relativamente leve, consistindo de abrir e fechar conexões sobre TCP e RTP e fornecer diferentes números de portas para diferentes aplicações sobre TCP e UDP. Se necessário, essas funções podem ser aumentadas por aplicações individuais (ou bibliotecas usadas por essas aplicações). Similarmente, IP é projetado em volta da ideia de tratar a rede abaixo dele como uma caixa preta de forma que ela possa ser considerada como uma única camada para os propósitos de discussão sobre TCP/IP.

O modelo TCP/IP está dividido em quatro camadas

• Camada de aplicação (FTP, SMTP, TELNET, HTTP, HTTPS, etc)

• Camada de transporte (TCP, UDP)

• Camada de internet (IP)

• Camada física (Ethernet)

Page 63: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

63www.acasadoconcurseiro.com.br

Semelhanças:

• Ambos têm camadas;

• Ambos têm camadas de aplicação, embora incluam serviços diferentes;

• Ambos têm camadas de transporte e de rede comparáveis;

• A tecnologia de comutação de pacotes (e não comutação de circuitos) é presumida por ambos;

• Os profissionais da rede precisam conhecer ambos.

Diferenças:

• TCP/IP combina os aspectos das camadas de apresentação e de sessão dentro da sua camada de aplicação;

• TCP/IP combina as camadas física e de enlace do OSI em uma camada;

• TCP/IP parece ser mais simples por ter menos camadas;

• Os protocolos do TCP/IP são os padrões em torno dos quais a Internet se desenvolveu, portanto, o modelo TCP/IP ganha credibilidade apenas por causa dos seus protocolos. Em contraste, nenhuma rede foi criada em torno de protocolos específicos relacionados ao OSI, embora todos usem o modelo OSI para guiar seu raciocínio.

Page 64: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento
Page 65: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br 65

Questões

1. (2018 – CESPE – EBSERH – Técnico em In-formática)

Julgue o item subsecutivo, a respeito dos componentes de um computador. O ende-reço físico MAC está associado à interface de comunicação que identifica, de forma única, cada dispositivo conectado a uma rede de computadores.

( ) Certo   ( ) Errado

2. (2018 – CESPE – ABIN – Oficial de Inteligên-cia – Área 4)

A respeito de redes de computadores, jul-gue o item subsequente. As trocas de men-sagens entre os componentes de hardware ou de software de dispositivos conectados em rede, como, por exemplo, smartphones e tablets, são definidas por meio de proto-colos, que, em última instância, envolvem as atividades de duas ou mais entidades re-motas comunicantes na Internet.

( ) Certo   ( ) Errado

3. (2018 – CESPE – ABIN – Oficial de Inteligên-cia – Área 4)

A respeito de Internet das coisas (IoT), jul-gue o item que se segue. Em uma residên-cia, caracteriza uma solução de IoT a insta-lação de um detector de fumaças capaz de gerar alertas em caso de fumaça e ser acio-nado, a partir de um smartphone, para ini-ciar um mecanismo de reação.

( ) Certo   ( ) Errado

4. (2018 – CESPE – EMAP – Analista Portuário – Tecnologia da Informação)

Com relação a equipamentos de rede e pro-tocolo ethernet, julgue o próximo item. O padrão fast ethernet utiliza o procedimen-to de autonegociação, que permite, entre duas estações conectadas, a negociação au-tomática da velocidade e do tipo de duplex.

( ) Certo   ( ) Errado

5. (2018 – CESPE – EMAP – Analista Portuário – Tecnologia da Informação)

A respeito de redes sem fio, VoIP e telefonia IP, julgue o item a seguir. Uma rede wireless ad hoc é um conjunto de computadores co-nectados entre si, sem ponto de acesso e sem acesso à Internet.

( ) Certo   ( ) Errado

6. (2018 – CESPE – EMAP – Analista Portuário – Tecnologia da Informação)

Acerca de redes de computadores, julgue o item subsequente. Com a criação do proto-colo TCP, que é orientado a conexões, o pro-tocolo UDP deixou de ser utilizado.

( ) Certo   ( ) Errado

7. (2018 – CESPE – EBSERH – Téc. em Informática)

Acerca dos fundamentos de comunicação de dados, dos sistemas de transmissão digi-tal e analógica e das arquiteturas OSI e TCP/IP, julgue o item subsequente. Com relação à direção do fluxo de dados, no modo de comunicação half-duplex uma estação pode realizar tanto a transmissão quanto a recep-ção, no entanto, elas não podem ocorrer ao mesmo tempo.

( ) Certo   ( ) Errado

Page 66: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br66

8. (2018 – CESPE – EBSERH – Técnico em In-formática)

Acerca dos fundamentos de comunicação de dados, dos sistemas de transmissão digi-tal e analógica e das arquiteturas OSI e TCP/IP, julgue o item subsequente. No modelo OSI, a compressão de dados é um exemplo de serviço fornecido pela camada de apre-sentação.

( ) Certo   ( ) Errado

9. (2018 – CESPE – EBSERH – Técnico em In-formática)

Acerca dos fundamentos de comunicação de dados, dos sistemas de transmissão digi-tal e analógica e das arquiteturas OSI e TCP/IP, julgue o item subsequente. Na arquite-tura TCP/IP, a camada Internet tem como principal função permitir que as entidades pares dos hosts de origem e de destino mantenham uma conversação.

( ) Certo   ( ) Errado

10. (2018 – CESPE – EBSERH – Técnico em In-formática)

No que diz respeito às redes LANs e WANs e aos protocolos e serviços de redes de com-putadores, julgue o item subsecutivo. Uma LAN física relativamente grande pode ser di-vidida em duas LANs lógicas menores.

( ) Certo   ( ) Errado

11. (2018 – CESPE – EBSERH – Técnico em In-formática)

No que diz respeito às redes LANs e WANs e aos protocolos e serviços de redes de computadores, julgue o item subsecutivo. A maioria das WANs, por serem redes de lon-ga distância, não utiliza roteadores conecta-dos entre as linhas de transmissão, uma vez que esses equipamentos são de difícil confi-guração e tornam as redes mais lentas.

( ) Certo   ( ) Errado

12. (2018 – CESPE – STJ – Técnico Judiciário – Desenvolvimento de Sistemas)

Julgue o item a seguir a respeito de topo-logias de redes de computadores. Devido à sua estrutura, em uma rede usando a topo-logia estrela, o isolamento de falhas é uma tarefa complexa, o que representa uma des-vantagem dessa topologia.

( ) Certo   ( ) Errado

13. (2018 – CESPE – STJ – Técnico Judiciário – Desenvolvimento de Sistemas)

Julgue o item a seguir a respeito de topo-logias de redes de computadores. A topolo-gia anel tem a fragilidade de tornar a rede inoperável ao tráfego unidirecional. Para transpor essa fragilidade, faz-se necessária a utilização de uma topologia híbrida.

( ) Certo   ( ) Errado

14. (2018 – CESPE – STJ – Técnico Judiciário – Desenvolvimento de Sistemas)

Julgue o item seguinte, que trata de arqui-tetura de rede, protocolo de rede, tipo de serviço de rede e QoS. Em um serviço orien-tado a conexão, é possível fazer controle de fluxo e congestionamento.

( ) Certo   ( ) Errado

15. (2018 – CESPE – STJ – Técnico Judiciário – Telecomunicações e Eletricidade)

Acerca de arquitetura de redes de compu-tadores e seus componentes, julgue o item a seguir. Em um roteador, as conexões LAN são dedicadas aos equipamentos da rede interna, enquanto a conexão WAN deve ser conectada ao gateway para garantir acesso à Internet.

( ) Certo   ( ) Errado

Page 67: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br 67

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

16. (2018 – CESPE – STJ – Técnico Judiciário – Telecomunicações e Eletricidade)

Acerca de arquitetura de redes de computa-dores e seus componentes, julgue o item a seguir. Diferentemente de roteadores, que encaminham os pacotes apenas aos equi-pamentos de destino, os switches encami-nham os pacotes a todos os equipamentos que estão conectados na rede.

( ) Certo   ( ) Errado

17. (2018 – CESPE – STJ – Técnico Judiciário – Telecomunicações e Eletricidade)

Acerca dos principais protocolos de comu-nicação utilizados na Internet, julgue o item subsecutivo. No modelo OSI de redes de computadores, o TCP está localizado em uma camada superior ao IP.

( ) Certo   ( ) Errado

18. (2018 – CESPE – STJ – Técnico Judiciário – Suporte Técnico)

Acerca de topologias e equipamentos de rede, julgue o item seguinte. Em uma rede local sem fio que utilize equipamentos de access point operando no padrão IEEE 802.11b, o tráfego de dados pode atingir velocidade de até 54 Mbps.

( ) Certo   ( ) Errado

19. (2018 – CESPE – STJ – Técnico Judiciário – Suporte Técnico)

Acerca de topologias e equipamentos de rede, julgue o item seguinte. Com a fina-lidade de interligar duas ou mais redes de dados diferentes, podem-se utilizar rotea-dores ou switches conhecidos como layer 3 ou camada 3.

( ) Certo   ( ) Errado

20. (2018 – CESPE – STJ – Técnico Judiciário – Suporte Técnico)

Acerca de IP e TCP, julgue o item que se se-gue. O TCP possui capacidade de controle de conexões, utilizando o envio e recebi-mento de flags para validar ou testar o esta-do de uma conexão. A flag do tipo SYN faz o pedido de abertura de conexão.

( ) Certo   ( ) Errado

Gabarito: 1. Certo 2. Certo 3. Certo 4. Certo 5. Certo 6. Errado 7. Certo 8. Certo 9. Errado 10. Certo  11. Errado 12. Errado 13. Errado 14. Certo 15. Certo 16. Errado 17. Certo 18. Errado 19. Certo 20. Certo

Page 68: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

68 www.acasadoconcurseiro.com.br

PYTHON

Python é uma linguagem de programação de alto nível (longe do código de máquina e mais próximo à linguagem humana), interpretada, de script, imperativa, orientada a objetos, fun-cional, de tipagem dinâmica e forte. Foi lançada por Guido van Rossum em 1991. Atualmente possui um modelo de desenvolvimento comunitário, aberto e gerenciado pela organização sem fins lucrativos Python Software Foundation (PSF). Apesar de várias partes da linguagem possuir padrões e especificações formais, a linguagem como um todo não é formalmente especificada. Foi fortemente influenciada pelas linguagens ABC e Java e pode ser executada em qualquer plataforma, inclusive tem IDE de desenvolvimento para Smartphones Android (QPython).

A linguagem foi projetada com a filosofia de enfatizar a importância do esforço do programador sobre o esforço computacional. Prioriza a legibilidade do código sobre a velocidade ou expressividade. Combina uma sintaxe concisa e clara com os recursos poderosos de sua biblioteca padrão (conceito Battery Included) e por módulos e frameworks desenvolvidos por terceiros.

Python é uma linguagem de propósito geral de alto nível, multiparadigma, suporta o paradigma orientado a objetos, imperativo, funcional e procedural. Possui tipagem dinâmica e uma de suas principais características é permitir a fácil leitura do código e exigir poucas linhas de código se comparado ao mesmo programa em outras linguagens. Devido às suas características, ela é principalmente utilizada para processamento de textos e dados científicos.

O nome Python teve a sua origem no grupo humorístico britânico Monty Python, criador do programa Monty Python’s Flying Circus, embora muitas pessoas façam associação com o réptil do mesmo nome (em português, píton).

Características gerais da linguagem

• Linguagem se caracteriza pela Simplicidade.

• Interpretador já vem no MacOs e Linux. Para Windows é necessário fazer download dos binários da IDE de desenvolvimento padrão do Python, o IDLE. Outra IDE, com mais recursos é PyCharm Community.

• Códigos podem ser reaproveitados salvando-os em scripts com a extensão *.py.

• Variáveis não precisam ser declaradas como string, boolean, int ou float (números não inteiros), pois o interpretador identifica o conteúdo e faz a declaração.

• A atribuição de variáveis é realizada com o sinal de =. O operador de comparação igual é representado como ==. Para representar exponenciação usamos **. Ex.: 3 ao quadrado, representamos como: 3**2

Page 69: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

69www.acasadoconcurseiro.com.br

• Para testes simples na versão 2.7.10, não é necessário instalar nada (nem interpretador / binários nem as IDEs). Podemos rodar comandos Python usando o navegador na URL: https://repl.it/repls/OptimalNoisySemicolon

• A linguagem é muito utilizada para cálculos Arrays ou Listas, conforme exercícios abaixo.

• A indentação é uma característica peculiar na linguagem. Enquanto que os blocos são delimitados explicitamente em C, Java e PHP por chaves e em Pascal e Fortran por palavras-chave como then e endif, em Python blocos são delimitados por espaços ou tabulações formando uma indentação visual; não existem símbolos de “abre” e “fecha”. Python requer uma indentação padronizada. Em outras linguagens, como JavaScript, a indentação não é necessária devido aos delimitadores de blocos, sendo utilizada somente para melhor visualização. Ao se usar um editor de texto comum, é fácil haver erros de indentação, sendo conveniente configurar o editor para a indentação do Python. As IDEs que suportam Python têm, em geral, a função de indentação automática.

Page 70: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento
Page 71: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br 71

Questões

1. (2017 – PUC-PR – TJ-MS – Técnico de Nível Superior – Analista de Infraestrutura de Rede)

Dentre as seguintes funções, a que serve para converter um caractere único no seu respectivo valor inteiro em Python é

a) unichr (x) b) hex (x) c) ord (x) d) oct (x) e) chr (x)

2. (2017 – FUNCERN – IF-RN – Professor – Sis-temas de Informação)

Observe os seguintes comandos em Python:

Ao término da execução da última linha, o programa deverá imprimir

a) [2, 9, 1, 0]b) [2, 9, 0, 5]c) [2, 0, 1, 5]d) [0, 9, 1, 5]

3. (2017 – FUNCERN – IF-RN – Professor – Sis-temas de Informação)

Em relação às estruturas de controles da lin-guagem de programação Python, a palavra

a) pass tem o mesmo efeito que a palavra continue do C++.

b) elif vem acompanhada de parênteses e dois pontos.

c) null representa o tipo para objetos nu-los.

d) else pode ser usada opcionalmente jun-to ao laço while ou for.

4. (2017 – NC-UFPR – ITAIPU BINACIONAL – Profissional de Nível Superior Jr – Compu-tação ou Informática – Suporte)

Três tipos de dados fundamentais em Python são as listas (“lists”), sequências ou ‘tuplas’ (“tuples”) e dicionários (“dictiona-ries”). A respeito dessas estruturas, é corre-to afirmar:

a) Listas não podem ser modificadas de-pois de criadas, ao passo que sequên-cias e dicionários podem.

b) Listas podem ser modificadas, mas seu tamanho não pode ser modificado após a criação, ao passo que sequências e di-cionários não têm essa limitação.

c) Dicionários não podem ser modificados depois de criados, ao passo que listas e sequências podem.

d) Listas e sequências são indexadas por inteiros, ao passo que dicionários po-dem ser indexados por “strings”.

e) Listas e dicionários são indexados por inteiros, ao passo que sequências po-dem ser indexadas por “strings”.

5. (2017 – COSEAC – UFF – Técnico de Tecno-logia da Informação)

São exemplos de frameworks, linguagem de programação ou tecnologia que, quando utilizados isoladamente, geram páginas di-nâmicas:

a) Fortran e JSP. b) HTML e PHP. c) CSS e HTML. d) HTML e Javascript. e) Python e ASP.

Page 72: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br72

6. (2017 – IF-CE – Técnico de Laboratório – In-formática)

Analise o código Python (versão 3) mostra-do a seguir.

Ao final da execução desse código, os valo-res, na variável lista, estarão

a) removidos da variável, devido a um erro no código.

b) ordenados de forma crescente. c) ordenados de forma decrescente. d) embaralhados, não sendo possível pre-

ver a ordem dos valores. e) duplicados, devido a um erro no código.

7. (2017 – IF-CE – Técnico de Laboratório – In-formática)

Considere o trecho do programa Python abaixo.

Os valores impressos, ao se executar o pro-grama, são, respectivamente,

a) 1 e 1.

b) 10. c) 1 e 10. d) 10 e 1. e) 10 e 10.

8. (2017 – IF-CE – Técnico de Laboratório – In-formática)

Considere as afirmações sobre os paradig-mas de linguagens de programação.

I. Python, Ruby e Java são linguagens de programação interpretada multiparadigma, de tipagem dinâmica e forte.

II. As linguagens de programação Object--Pascal, C++ e Java, embora deem suporte à Orientação a Objetos (OO), não são comple-tamente orientadas a objetos.

III. As linguagens de programação Smalltalk e Ruby são consideradas puramente orien-tadas a objetos, isto é, tudo é considerado um objeto, até mesmo os tipos básicos da linguagem.

Está(ão) correta(s):

a) II, apenas. b) I, II e III. c) III, apenas. d) I e II, apenas. e) II e III, apenas.

9. (2017 – IFB – Professor – Informática/ De-senvolvimento de Sistemas)

Com relação a Algoritmos e Estrutura de Dados, dadas as afirmações abaixo, segun-do Farrer (1999), assinale a alternativa COR-RETA:

a) Python é uma linguagem compilável, a qual, após esse processo, gera um ar-quivo executável, do tipo binário.

b) A declaração de variáveis é algo obriga-tório em Python.

c) Python é uma linguagem procedural a qual não contempla orientação a obje-tos.

Page 73: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br 73

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

d) Listas, em Python, são conjuntos de va-lores, os quais só podem ser do mesmo tipo, acessados por um índice numérico que inicia em 0 (zero).

e) Em comandos condicionais ou de repe-tição, a separação de blocos de código em Phyton é feita utilizando a indenta-ção.

10. (2017 – IFB – Professor – Informática/ De-senvolvimento de Sistemas)

Dado o código em Python abaixo, assinale a alternativa que contém a sequência COR-RETA de números da saída gerada pelos co-mandos “print”:

a) 64, 32, 1024, 1024, 512 b) 32, 16, 512, 1024, 256 c) 64, 32, 512, 1024, 256 d) 64, 32, 1024, 1024, 256 e) 32, 16, 512, 1024, 512

11. (2017 – IFB – Professor – Informática/ Desenvolvimento de Sistemas)

Dado o código em Python abaixo, assinale a alternativa que contém a saída CORRETA gerada pelo “print”:

a) galinha b) ga c) t d) gato e) to

12. (2016 – MS CONCURSOS – Creci – 1° Região (RJ) – Analista de TI)

Qual alternativa representa a declaração de uma variável do tipo texto, na linguagem de programação Python?

a) var valor = 3; b) boolean inicio = falso; c) textp = “texto de exemplo”; d) int i = 1;

13. (2016 – IF-PE – Técnico em Tecnologia da Informação – Desenvolvimento)

Uma das estruturas de dados existentes na linguagem de programação Python são as listas. Considere o trecho de código abaixo:

candidatos = [‘José’, ‘João’, ‘Cibelly’, ‘Sonivaldo’,’Dariane’]

É CORRETO afirmar que

a) candidatos.len() obtem o tamanho da lista.

b) o método append é utilizado para adi-cionar um elemento no início da lista.

Page 74: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br74

c) o comando insert(‘Antônio’) insere “An-tônio” no início da lista.

d) candidatos[-2] retornaria o penúltimo elemento da lista.

e) candidatos.size() obtem o tamanho da lista.

14. (2016 – COMPERVE – UFRN – Técnico de Tecnologia da Informação)

Analise o trecho de código Python a seguir, escrito para a versão 2.6.

v=range(10)temp=v[2:7:2]s=0for n in temp: s+=nprint(s)

Após a execução do código Python, o valor da variável s impresso na tela é

a) 6 b) 12 c) 20 d) 9

15. (2016 – COMPERVE – UFRN – Técnico de Tecnologia da Informação)

Analise o trecho de código Python a seguir, escrito para a versão 2.6.

Após a execução do código Python, o valor da variável n impresso na tela é

a) 12 b) 13 c) 19 d) 20

16. (2016 – UFMT – UFMT – Técnico de Tecno-logia da Informação)

Sobre as linguagens de programação mais utilizadas na academia e indústria, marque V para as afirmativas verdadeiras e F para as falsas.

( ) Os códigos-fontes em Python devem ser compilados pelo compilador Python que pode ser utilizado em ambientes Windows e Linux.

( ) A linguagem de programação C++ sur-giu para substituir a linguagem C, pois C é obsoleta e não é mais utilizada.

( ) Java é uma linguagem de programação orientada a objetos que é executada em uma máquina virtual Java (JVM).

( ) As linguagens de programação C++, Python e Java utilizam o modelo de orienta-ção a objetos.

Assinale a sequência correta.

a) V, V, F, F b) F, V, F, V c) V, F, V, F d) F, F, V, V

17. (2016 – CESGRANRIO – UNIRIO – Técnico em Tecnologia da Informação)

Considere o seguinte código em Python

A saída na tela após a execução será

a) Fulano m b) Fulano 2500.0 c) Fulano de Tal m d) Fulano de Tal 2500.0 e) Fulano de Tal m 2500.0

Page 75: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br 75

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

18. (2017 – IFB – Professor – Informática/ Desenvolvimento de Sistemas)

Analise o trecho de código escrito em Python versão 3 a seguir:

Marque a alternativa que apresenta a saída impressa no console.

a)

0 2.5 Alface 1 5.5 Batata 2 1.5 Chuchu 3 4.5 Tomate

b)

0 Alface 2.5 1 Batata 5.5 3 Chuchu 1.5 4 Tomate 4.5

c)

0 Alface 2.5 1 Chuchu 1.5 2 Batata 5.5 3 Tomate 4.5

d)

1.5 0 Chuchu 2.5 1 Alface 4.5 2 Tomate 5.5 3 Batata

e)

Chuchu 1.5 0 Alface 2.5 1 Tomate 4.5 2 Batata 5.5 3

Page 76: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br76

19. (2017 – IFB – Professor – Informática/ De-senvolvimento de Sistemas)

Analise o trecho de código escrito em Python versão 3 a seguir:

dados = [[“maria”,18], [“carlos”,16], [“alex”,17], [“sandra”,15]]

for i in dados:

print(i[1])

Marque a alternativa que apresenta a saída impressa no console.

a) 15 16 17 18

b) 18 16 17 15

c) maria carlos alex sandra

d) alex carlos maria sandra

e) maria 18 carlos 16 alex 17 sandra 15

20. (2015 – UFPel-CES – UFPEL – Técnico em Tecnologia da Informação)

Em relação às características da linguagem Python, é correto afirmar que

a) tem suporte a herança múltipla e poli-morfismo.

b) é uma linguagem fortemente tipada, ou seja, é preciso declarar variáveis e seus tipos.

c) deve ser usada, exclusivamente, para programação web.

d) uma lista em Python é um conjunto de valores acessados por um índice nu-mérico, inteiro, começando em 1. As-sim como em outras linguagens, a lista pode armazenar apenas valores de um mesmo tipo.

e) uma String Python é uma sequência imutável, alocada estaticamente, com restrição de tamanho.

Gabarito: 1. C 2. A 3. D 4. D 5. E 6. D 7. C 8. E 9. E 10. A 11. C 12. C 13. D 14. B 15. C 16. D  17. B 18. C 19. B 20. A

Page 77: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

77www.acasadoconcurseiro.com.br

LINGUAGEM R E R STUDIO

R é uma linguagem e também um ambiente de desenvolvimento integrado para cálculos estatísticos e gráficos.

Foi criada originalmente por Ross Ihaka e Robert Gentleman no departamento de Estatística da universidade de Auckland, Nova Zelândia, e foi desenvolvido em um esforço colaborativo de pessoas em vários locais do mundo.

R é uma linguagem e um ambiente similar ao S podendo ser considerado uma implementação distinta do S. Muitos códigos escritos para o S podem ser executados inalterados no R.

O código fonte do R está disponível sob a licença GNU GPL (software livre) e as versões binárias são fornecidas para Windows, Macintosh, e muitos sistemas operacionais Unix/Linux.

R é também altamente expansível com o uso dos pacotes, que são bibliotecas para funções específicas ou áreas de estudo específicas. Ex.: Para importar um arquivo .xlsx (Excel) o R Studio precisa de módulos, que são automaticamente importados. Um conjunto de pacotes é incluído com a instalação de R.

A linguagem R é largamente usada entre estatísticos e analistas de dados para desenvolver softwares de estatística e análise de dados. Pesquisas e levantamentos com profissionais da área mostram que a popularidade do R aumentou substancialmente nos últimos anos.

Componentes usados para programar em R

1) Pacote com a linguagem – https://cran.r-project.org/bin/windows/base/2) Interface de programação RStudio – https://www.rstudio.com/products/rstudio/download/

Page 78: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

78 www.acasadoconcurseiro.com.br

Área de trabalho do RStudio

1) Painel superior esquerdo – local para edição de scripts.

2) Painel inferior esquerdo – Console, local para execução dos comandos.

3) Painel superior direito – local onde podemos importar conjuntos de dados (botão Import Dataset) e visualizar o histórico dos comandos já executados.

4) Painel inferior direito

a. Files – Mostra a estrutura de pastas do Windows / Linux / Mac.b. Plots – Mostra os gráficos gerados.c. Packages – Mostra os pacotes instalados e permite atualização dos mesmos.d. Help – Mostra a ajuda do RStudio.

Alguns comandos básicos da Linguagem R

mean () – calcula a média aritmética.

sum () – Faz a soma de números.

max () – Mostra o valor máximo.

min () – Mostra o valor mínimo.

median () – Calcula a mediana.

plot() – gera um gráfico com os dados.

view(nome_arquivo) – Mostra o conteúdo do arquivo importado.

CTRL + L – Limpa a tela (Console)

<- atribuição de valores. Ex.: sequencia <- 1:40 (variável “sequencia” recebe os números entre 1 e 40.

aleatorios <- Runif (1000, Min 100, Max 5000) – Gera 1000 números aleatórios entre 100 e 5000.

pares <- Seq(2,40, by=2) – Gera os números pares (by=2) entre 2 e 40.

numeros <- 1:50 – Gera os números de 1 a 50.

Page 79: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

79www.acasadoconcurseiro.com.br

Questão do Banco do Brasil (2018)

O script em R apresentado abaixo gera um determinado gráfico.

c=1:6 x=c(2,4,6) y<-x+c rev(c)->k f=sort(y) barplot(f)

Que gráfico é gerado por esse script?

Explicação:

1) c=1:6 à c = 1, 2, 3, 4, 5, 62) x=c(2,4,6) à x = 2, 4, 63) y<-x+c à y = (2+1), (4+2), (6+3), (2+4), (4+5), (6+6) à y = 3, 6, 9, 6, 9, 124) rev(c)->k à Não importa, pois o valor de k não é utilizado5) f=sort(y) à f recebe o array y ordenado: 3, 6, 6, 9, 9, 126) barplot(f) à gera um gráfico em barras com o valores do array f

Resposta:

Page 80: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

80 www.acasadoconcurseiro.com.br

API (APPLICATION PROGRAMMING INTERFACE)

Interface de Programação de Aplicação, cujo acrônimo API provém do Inglês Application Programming Interface, é um conjunto de rotinas e padrões estabelecidos por um software para a utilização das suas funcionalidades por aplicativos que não pretendem envolver-se em detalhes da implementação do software, mas apenas usar seus serviços.

De modo geral, a API é composta por uma série de funções acessíveis somente por programação, e que permitem utilizar características do software menos evidentes ao usuário tradicional.

Por exemplo, um sistema operacional possui uma grande quantidade de funções na API, que permitem ao programador criar janelas, acessar arquivos e cifrar dados. As APIs dos sistemas operacionais costumam ser dissociadas de tarefas mais essenciais, como a manipulação de blocos de memória e acesso a dispositivos. Essas tarefas são atributos do núcleo de sistema e raramente são programáveis.

Mais recentemente, o uso de API tem se generalizado nos plug-ins (acessórios que complementam a funcionalidade de um programa). Os autores do programa principal fornecem uma API específica para que outros autores criem plug-ins, estendendo as funcionalidades do programa.

Enquanto você usufrui de um aplicativo ou site, este pode estar conectado a diversos outros sistemas e aplicativos via APIs sem que se perceba. APIs utilizadas em sites também podem ser chamadas de Web Service.

Ela funciona através da comunicação entre diversos códigos, definindo assim comportamentos específicos de determinados objetos em uma interface. Ou seja, a API irá interligar diversas funções em um site (por exemplo, busca de imagens, notícias, artigos, etc.) de modo a possibilitar que possam ser utilizadas em outras aplicações.

Sistemas operacionais também possuem APIs e elas continuam tendo a mesma função. O Windows, por exemplo, possui APIs como a Win16 API, Win32 API ou Telephony API, em todas as suas versões. Ao executar um programa que envolva algum processo do sistema operacional, é provável que ele faça uma conexão com alguma API do Windows.

Exemplos

Para clarear o conceito de API, vamos dar alguns exemplos de como ela funciona. No Windows, ela funciona num aplicativo que se utilize do relógio do sistema, por exemplo, para exibir a mesma função dentro do programa ou então associar algum comportamento a determinada hora do relógio.

Quando o assunto é web, a funcionalidade da API pode ser ainda maior. Existem diversos serviços que disponibilizam seus códigos para serem utilizados em outros sites. Talvez o melhor exemplo disso seja o Google Maps. Diversos outros sites utilizam este serviço dentro de suas páginas, usando o código original e adaptando-o da maneira mais conveniente.

Page 81: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

81www.acasadoconcurseiro.com.br

Assim, quando você acessa uma página de um guia de restaurantes em sua cidade, por exemplo, pode visualizar sua localização através de um mapa fornecido pelo Google Maps. Isto é realizado através da API. Através dela, desenvolvedores de softwares e programadores da web podem criar belos programas e páginas, repletos de conteúdo para seus usuários.

Além de sistemas operacionais e páginas da web, APIs são encontradas também em tocadores de mídias e conectam as funções de áudio e de vídeo em serviços de transmissão. É uma API que permite e realiza, de fato, a transmissão de áudio e vídeo da grande rede para o seu computador. Enfim, APIs diferentes estão presentes em navegadores, aplicativos de variadas linguagens e para variadas finalidade.

Nomes de APIs do HTML 5

HTML GeolocationHTML Drag and DropHTML Local StorageHTML Application CacheHTML Web WorkersHTML SSECanvas

Nomes de APIs do Java

JBDC – API para comunicação do Java com Banco de DadosJPA – Java Persistent APIJTA – Java Transaction API

Page 82: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

82 www.acasadoconcurseiro.com.br

METADADOS DE ARQUIVOS

Metadados ou metainformação são dados sobre outros dados. Um item de um metadado pode dizer do que se trata aquele dado, geralmente uma informação inteligível por um computador. Os metadados facilitam o entendimento dos relacionamentos e a utilidade das informações dos dados.

Por exemplo a tecnologia conhecida por “data warehouse” consiste em extrair e consolidar dados de múltiplas fontes numa base de dados que possa ser consultada de várias maneiras pelos utilizadores com ferramentas de suporte à decisão. Os metadados são neste contexto um instrumento essencial para a gestão do repositório e incluem informações como lista de conteúdo, origem dos dados, transformações (como filtragens ou cálculos efetuados na transferência para a localização atual), versão, modelos de dados, entre outros.

Conceito da arquivologia

Os documentos recebidos pelo protocolo são registrados em formulários ou em sistemas eletrônicos, nos quais serão descritos os dados referentes ao seu número, nome do remetente, data e assunto, espécie, entre outros elementos. Os elementos utilizados para o registro de documentos nos serviços de protocolo são metadados desses documentos.

Metadados: Dados estruturados e codificados, que descrevem e permitem acessar, gerenciar, compreender e/ou preservar outros dados ao longo do tempo.

Parágrafo 3º do artigo 3º da Resolução 20 do CONARQ tem uma definição bastante próxima desta: §3º Os metadados são informações estruturadas e codificadas que descrevem e permitem gerenciar, compreender, preservar e acessar os documentos digitais ao longo do tempo. Os metadados referem-se a:

• Identificação e contexto documental (identificador único, instituição produtora, nomes, assunto, datas, local, código de classificação, tipologia documental, temporalidade, destinação, versão, documentos relacionados, idioma e indexação),

• Segurança (categoria de sigilo, informações sobre criptografia, assinatura digital e outras marcas digitais),

• Contexto tecnológico (formato de arquivo, tamanho de arquivo, dependências de hardware e software, tipos de mídias, algoritmos de compressão)

• Localização física do documento

Metadados no Windows

No ambiente de sistemas operacionais os metadados podem ser identificados como “Propriedades dos arquivos” e serem acessados, clicando sobre o arquivo, escolhendo a opção “Propriedades” e então a guia “Detalhes”. Também podem ser visualizados no “Painel de Detalhes” do Explorador de arquivos do Windows. A tecla de atalho é ALT + ENTER.

Page 83: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

Polícia Federal (Escrivão e Agente de Polícia) – Informática – Prof. Márcio Hunecke

83www.acasadoconcurseiro.com.br

Normalmente é representado pelo ícone abaixo, localizado no canto superior esquerdo do Explorador de arquivos do Windows 10.

Alguns metadados podem ser editados / alterados pelo usuário e outros não, mas todos são utilizados pelas ferramentas de pesquisa do Windows.

Page 84: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento
Page 85: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br 85

Questões

1. (2018 – CESPE – IFF – Arquivista)

O protocolo realiza várias atividades, entre as quais está a identificação dos metada-dos, que é conhecida como

a) registro. b) expedição. c) tramitação. d) distribuição. e) recebimento.

2. (2018 – CESPE – ABIN – Oficial Técnico de Inteligência – Área 10)

Julgue o item seguinte, no que se refere às políticas de acesso aos documentos de ar-quivo, às ontologias e aos metadados. Os metadados são dados utilizados para a cria-ção e o uso de documentos em sistemas in-formatizados indisponíveis aos usuários.

( ) Certo   ( ) Errado

3. (2015 – CESPE – FUB – Arquivista)

Acerca dos documentos digitais e dos meta-dados, julgue o item subsequente. Os meta-dados, que funcionam como indexadores e contextualizadores dos documentos captu-rados pelos sistemas gerenciadores, devem funcionar de forma independente do siste-ma, em formatos abertos e armazenados na própria estrutura dos depósitos digitais.

( ) Certo   ( ) Errado

4. (2015 – CESPE – FUB – Arquivista)

Acerca dos documentos digitais e dos meta-dados, julgue o item subsequente. A infor-mação que descreve a estrutura dos dados e sua relação com outros dados é o meta-dado.

( ) Certo   ( ) Errado

5. (2015 – CESPE – STJ – Analista Judiciário – Arquivologia)

Acerca de protocolo, julgue o seguinte item. Os metadados sobre o documento de arqui-vo que entra no protocolo são identificados na rotina conhecida como registro.

( ) Certo   ( ) Errado

6. (2011 – CESPE – CNPQ – Analista em Ciên-cia e Tecnologia Júnior – Geral)

Julgue os itens a seguir, referentes à orga-nização e gerenciamento de arquivos e pas-tas. As propriedades de um documento, também conhecidas como metadados, são detalhes de um arquivo que o descrevem ou o identificam. As propriedades incluem detalhes como título, nome do autor, assun-to e palavras-chave que identificam o tópico ou o conteúdo do documento.

( ) Certo   ( ) Errado

7. (2013 – CESPE – Polícia Federal – Escrivão da Polícia Federal)

Acerca de organização, processos e geren-ciamento de informações, julgue os itens que se seguem. Título, assunto, palavras--chave e comentários de um documento são metadados típicos presentes em um do-cumento produzido por processadores de texto como o BrOffice e o Microsoft Office.

( ) Certo   ( ) Errado

Page 86: INFORMÁTICA - s3.amazonaws.com · • Sistemas de processamento em lote, ou sistemas “batch”: caracterizados pelas técnicas de programação sequencial, sistema de armazenamento

www.acasadoconcurseiro.com.br86

8. (2009 – CESPE – Banco do Brasil – Escriturário)

Julgue o item abaixo relativo a conceitos de aplicativos de informática utilizados em am-biente de escritório. Microsoft Word e Ope-nOffice Writer são processadores de texto do tipo WYSIWYG (what you see is what you get), e ambos são capazes de associar me-tadados aos documentos editados por meio deles, tais como título, assunto, palavras--chave e comentários acerca do documen-to, entre outros.

( ) Certo   ( ) Errado

Gabarito: 1. A 2. Errado 3. Certo 4. Certo 5. Certo 6. Certo 7. Certo 8. Certo