Categorias
Data Science Dica de Leitura

“Data Science para Negócios”: um livro indispensável do início ao fim

Em qualquer organização atualmente, independente do tamanho, a Ciência de Dados tem se tornado um tema relevante. O grande volume de dados produzido todos os dias é a chave para, por exemplo, aprimorar campanhas de marketing e aumentar os lucros das empresas. Mas, para que a análise das informações seja eficiente, é preciso pensar nos modelos implementados pelos data scientists  na exploração dos dados e também buscar uma gestão eficiente desse grupo de profissionais.

 

Escrito pelos renomados cientistas de dados Foster Provost e Tom Fawcett, o livro “Data Science para Negócios”,  baseado em um curso de MBA ministrado por Provost nos últimos dez anos na Universidade de Nova York, destina-se especialmente para aqueles leitores aspirantes a cientistas de dados e para os gerentes desses cientistas. Além de  um guia para aprender a melhorar a comunicação entre eles, o volume oferece uma diretriz completa sobre como participar inteligentemente em projetos dentro do ambiente comercial. Ao ler essa publicação, adquirimos uma visão mais completa do valor dos dados desde o ponto de vista de um negócio.

 

O livro aborda de uma forma menos técnica alguns dos principais algoritmos:  k-NN, árvores de decisão, máquina de vetores suporte, TF-IDF e regressão logística, mas sem se aprofundar na implementação destes. Um dos pontos fortes de “Data Science para Negócios” é justamente a diversidade de explicações dos assuntos abordados, utilizando recursos visuais para explicar os algoritmos. Outro ponto interessante é que, diferente de outros livros da área, este passa mais tempo discutindo os temas em aplicações práticas, o que deixa a teoria mais tangível.

 

Recomendamos esse livro para quem deseja ter uma visão geral da área e para aqueles que desejam gerenciar projetos e cientistas de dados em uma organização, e ainda aos que desejam aprender a  mostrar as vantagens da mineração, análise e visualização de dados de forma simples e eficaz. Se você é um desses, boa leitura!

 

 

Categorias
Data Science Pesquisa Webinar

Webinar: O Eixo de Pesquisa em Projetos de P&D – modelo Insight Lab

O Insight Lab, anuncia seu próximo webinar com o tema: O Eixo de Pesquisa em Projetos de P&D – modelo Insight Lab. Desta vez, você terá a oportunidade de assistir a um debate sobre pesquisa com especialistas de referência do nosso laboratório, autores de trabalhos reconhecidos internacionalmente.

Entenda o que é um projeto de pesquisa, as dificuldades, as contribuições, o tempo nos projetos, os projetos de inovação radical ou disruptiva e as práticas do laboratório Insight em P&D.

PARTICIPANTES

José Macedo – Coordenador do Insight Lab, Cientista-chefe de Dados do Governo do CE e Professor da UFC

Ticiana Linhares – Cientista de dados do Insight Lab e do Íris, e Professora da UFC. 

Régis Pires – Cientista de dados do Insight Lab e do Íris, e Professor da UFC. 

José Florêncio – Coordenador negocial e pesquisador do Insight Lab

PROGRAME-SE

O evento é aberto e destinado a todos os interessados no assunto. 

Terça-feira, 30/06, às 16h.

Transmissão pelo Youtube e Linkedin do Insight Lab.

Categorias
Ciência de Dados Destaque

Os 11 melhores canais de Data Science no Telegram

No Telegram, você encontra milhares de canais sobre os temas mais variados, entre eles, o de Ciência de Dados.

Nessa imensidão de conteúdos, é sempre bom ter uma dica para encontrar os melhores. Hoje, nós reunimos uma lista com 11 canais de Ciência de Dados no Telegram que todo cientista de dados precisa participar.

 

Confira:

1- (Canal) Insight Lab

Grupo de discussão do Insight Lab sobre Ciência de Dados, Inteligência Artificial e áreas correlatas.

 

2 – (Grupo) [DS & R] Ciência de Dados & R

Grupo destinado a estudantes e programadores da linguagem R ou de Ciência de Dados

 

3- (Grupo) Dados Abertos .BR

Discussões sobre tudo relacionado ao tema dados abertos no Brasil e no mundo. 

 

4- (Canal) Pizza de Dados

Notícias do Pizza de Dados,  podcast brasileiro sobre Ciência de Dados. Eles também divulgam notícias, eventos e dicas da área.

 

5 – (Canal) Data Science by ODS.ai

Muito popular no Telegram, o canal cobre conteúdos de IA, Big Data, Machine Learning, Estatística e Matemática em geral.

 

6 – (Canal) Artificial Intelligence && Deep Learning

Canal para quem é apaixonado por IA, Machine Learning, Deep Learning, Visão Computacional e Processamento de Imagem.

 

7 – (Canal) Artificial Intelligence

Focado em oferecer dicas de tutoriais, artigos, cursos e livros da área de Ciência de Dados.

 

8 – (Canal) Machine Learning

Divulgação de artigos de pesquisa, cursos e tutoriais em Data Science, IA e Machine Learning.

 

9 – (Grupo) bitgrit Data Science Community 

Com uma plataforma online de competições em IA, a bitgrit, seu grupo no telegram é voltado para cientistas de dados compartilharem seus conhecimentos e dúvidas na área.

 

10- (Canal) Data Learning 

Canal dedicado à Ciência de Dados, Machine Learning, Deep Learning e Redes Neurais. Aqui você vai encontrar livros, dicas de cursos, exemplos de aplicações e outros materiais. 

 

11- (Canal) Computer Science and Programing 

O canal traz um universo de conteúdos para você aprender Visão Computacional, Machine Learning, Deep Learning, IA e programação em Python.

 

Esse foi o último item da nossa lista, mas você também deve ter seus canais de Data Science preferidos, compartilha eles aqui nos comentários e ajude essa lista a crescer.

 

 

 

 

 

Categorias
Big Data Dados Mineração de Processos

O Papel da Mineração de Processos na Ciência de Dados

O interesse pela ciência de dados está crescendo rapidamente. Muitos a consideram como a profissão do futuro. O hype relacionado à Big Data e à análise preditiva ilustra isso. (“Big” e “Small”) Data são essenciais para pessoas e organizações, aumentando sua importância. No entanto, não é suficiente se concentrar no armazenamento e análise de dados. Um cientista de dados também precisa relacionar dados a processos operacionais e ser capaz de fazer as perguntas certas. 

A relevância da Mineração de Processos

Na última década, Process Mining (Mineração de Processos) surgiu como um novo campo de pesquisa que se concentra na análise de processos usando dados de eventos. As técnicas clássicas de mineração de dados, como classificação, clustering, regressão, aprendizado de regras de associação, não se concentram nos modelos de processos de negócios e geralmente são usadas apenas para analisar uma etapa específica do processo geral. 

Mineração de Processos se concentra nos processos fim-a-fim e isso é possível devido à crescente disponibilidade de dados de eventos e novas técnicas de descoberta de processos e verificação de conformidade. A relevância prática da mineração de processos e os interessantes desafios científicos tornaram essa nova área um dos hot topics da ciência de dados. 

O que é a mineração de processos? 

Primeiro precisamos definir formalmente o que essa nova área aborda. O ponto de partida para a mineração de processos é um log de eventos. Cada evento nesse log refere-se a uma atividade (isto é, uma etapa bem definida em algum processo) e está relacionado a um caso específico (isto é, uma instância do processo). 

Os eventos pertencentes a um caso são ordenados e podem ser vistos como uma “execução” do processo. Os logs de eventos podem armazenar informações adicionais sobre eventos. De fato, sempre que possível, as técnicas de mineração de processo usam informações extras, como o recurso (ou seja, pessoa ou dispositivo) que executa ou inicia a atividade, o registro de data e hora do evento ou elementos de dados registrados com o evento (por exemplo, o tamanho de um pedido). 

Assim, a mineração de processos visa descobrir, monitorar e melhorar processos reais extraindo conhecimento dos logs de eventos disponíveis nos sistemas de informações atuais. Ao usar process mining é possível descobrir processos reais, checar sua conformidade, quantificar os desvios, descobrir o que causa a variação dos processos, encontrar gargalos, predizer saídas dos processos, entre outros benefícios. O objetivo dessa área é transformar dados de eventos em insights e ações. Process mining é parte integrante da ciência de dados, estimulada pela disponibilidade de dados e pelo desejo de melhorar os processos. 

As três classificações de Mineração de Processos

A descoberta de processos constrói um modelo a partir de um log de eventos, sem nenhuma informação a priori. Um exemplo disso é o algoritmo alpha

Já as técnicas de conformidade visam analisar a compatibilidade de um log de eventos a um modelo de processo já existente. A verificação de conformidade pode ser usada para verificar se a realidade do modelo condiz com o que foi registrado no log e vice-versa.

Por fim, o aprimoramento melhora automaticamente um modelo de processo de acordo com um log de eventos. Enquanto a conformidade mede o alinhamento entre o modelo e a realidade, esse terceiro tipo de mineração de processo visa alterar ou estender o modelo a priori. 

Em que contexto é aplicado? 

Uma aplicação para mineração de processos é a pesquisa de serviços de saúde. Esse é um campo científico que analisa os workflows e os processos de monitoramento à saúde no que diz respeito à eficiência e eficácia. Um dos seus principais objetivos é o desenvolvimento e implementação de conceitos de assistência médica baseada em evidências. Portanto, esse área busca melhorar a qualidade de atendimentos médicos, considerando que os recursos disponíveis são escassos. Um objetivo importante é a validação de ensaios clínicos na literatura.

No contexto educacional, foi criada uma nova vertente, chamada EPM – Educational Process Mining (Mineração de processos educacionais), que tem como objetivo construir modelos de processos educacionais completos e compactos que sejam capazes de reproduzir todo o comportamento observado. Os resultados da EPM podem ser usados para obter uma melhor compreensão dos processos educacionais subjacentes, gerar recomendações e conselhos para os alunos, fornecer feedback aos alunos, professores e pesquisadores, para detectar precocemente dificuldades de aprendizado. 

Já no contexto de Engenharia de Software, foi definida uma subárea chamada Software Process Mining (Mineração de Processos de Software). Nesta área, as pessoas se concentram na análise de rastreamentos de tempo de execução para melhorar a arquitetura e o desempenho dos sistemas de software, e na análise do comportamento do usuário para melhorar o design e a usabilidade dos sistemas de software. 

Por fim

Em resumo, as técnicas de mineração de processos podem ser aplicadas em qualquer contexto, desde que seja possível transformar os dados de entrada em logs de eventos. Ela se tornou uma ferramenta vital para as organizações modernas que precisam gerenciar seus processos operacionais complexos, e por conta disso, ela se tornou um dos principais pilares da ciência de dados.

 

Referências Bibliográficas 

BOGARÍN, Alejandro et al. Clustering for improving educational process mining. In: Proceedings of the fourth international conference on learning analytics and knowledge. 2014. p. 11-15. 

RUBIN, Vladimir; LOMAZOVA, Irina; AALST, Wil MP van der. Agile development with software process mining. In: Proceedings of the 2014 international conference on software and system process. 2014. p. 70-74. 

VAN DER AALST, Wil. Data science in action. In: Process mining. Springer, Berlin, Heidelberg, 2016. p. 3-23. 

VAN DER AALST, Wil. Process mining: Overview and opportunities. ACM Transactions on Management Information Systems (TMIS), v. 3, n. 2, p. 1-17, 2012. 

VOGELGESANG, Thomas; APPELRATH, H.-Jürgen. Multidimensional process mining: a flexible analysis approach for health services research. In: Proceedings of the Joint EDBT/ICDT 2013 Workshops. 2013. p. 17-22. 

Categorias
Aplicativo Governo Segurança Pública UFC

Desenvolvido pela SSPDS em parceria com o Insight, aplicativo ajuda policiais penais em situação de risco

O Insight Lab, mais uma vez, colabora para o benefício da sociedade, com seu trabalho, por meio de parcerias na criação de tecnologias para a segurança pública. Desta vez, o aplicativo Portal Comando Avançado auxiliará na proteção de agentes públicos que trabalham em presídios e penitenciárias do Ceará. Com o botão de pânico, será possível aos agentes emitirem mensagem de alerta em situações de perigo.

Como funciona o App

Para emitir o alerta de perigo em situação de risco, o policial penal, bastará acionar o botão de alerta no aplicativo que emitirá um aviso à Coordenadoria Integrada de Operações (CIOPS). Esta, por sua vez, entrará em contato direto com o agente. Caso não haja resposta do emissor do alerta ou se comprove a situação de perigo, uma viatura policial será direcionada ao local do chamado de imediato.

O app, Portal Comando Avançado, já vem sendo utilizado por agentes da Secretaria de Segurança Pública do estado com funções de pesquisa e checagem de informações de veículos, documentos, consulta criminal e civil de suspeitos.

Parceria com a universidade

A tecnologia é fruto de uma parceria entre a Universidade Federal do Ceará (UFC), através do Insight Lab, coordenado pelo professor José Macedo e a Secretaria da Segurança Pública e Defesa social (SSPDS), que tem à frente o secretário André Costa.

Palavra dos especialistas

Mauro Albuquerque – SAP

O secretário da Secretaria da Administração Penitenciária (SAP), Mauro Albuquerque, destaca mais esse movimento em prol da proteção aos agentes. “Esse emprego da tecnologia e essa parceria com a Secretaria de Segurança é fundamental. Nós aprimoramos o trabalho, a segurança do Agente e o combate ao crime. Você ter uma informação rápida, um socorro rápido, é crucial para o combate ao crime. O crime está cada vez mais articulado. É fundamental para que nós possamos servir um serviço de qualidade e proteger nossos profissionais”, ressalta Mauro.

André Costa- SSPDS

O secretário da SSPDS, André Costa, destaca mais uma parceria de sucesso com a SAP. “Nós já temos integração de várias bases de dados e agora mais essa parceria. É um conjunto de ações buscando a proteção dos nossos agentes e no comando das pastas para proteger e zelar e quem ganha isso é a sociedade.”

José Macedo – UFC

O coordenador do Insight Lab da Universidade Federal do Ceará, José Macêdo, responsável por comandar a equipe, explica sobre a criação do aplicativo. “Eles (SSPDS) colocaram a necessidade e em três meses nós desenvolvemos a ferramenta. É bem utilizável, intuitiva e facilitada para os servidores da Segurança. Com a nossa equipe que envolve pesquisadores, desenvolvedores, alunos de Pós-Graduação, Mestrado, Doutorado e Docentes nós também damos o suporte quando necessário. A equipe de Tecnologia da Informação da SSPDS é apta a realizar todas as atualizações necessária, como acontece agora da utilização para os policiais penais”, afirma Macedo.

 

Fonte: ceara.gov.br

Categorias
Ciência de Dados Dica de Leitura Inteligência Artificial Machine Learning

10 livros para todo Cientista de Dados ler na quarentena

Se durante a sua vida profissional ou acadêmica, o grande problema foi encontrar tempo para ler, hoje, a realidade é outra. Pensando nisso o Insight Lab resolveu te dar uma ajudinha com dicas de leitura para você se aprimorar. Incluímos na lista obras técnicas e literárias que te trarão um conteúdo valioso e produtivo para sua carreira. Confira a lista.

 

1 – Python para Análise de Dados de Wes Mckinney.

Do mesmo criador da biblioteca Pandas, este volume é um guia para quem está no início da formação como programador. Ele ajuda a entender o funcionamento e a combinação de ferramentas para o tratamento de dados dentro do ambiente Python.

A obra é desenvolvida em seções curtas, o que torna a informação mais focada, isso ajudará o programador iniciante a identificar claramente os pontos centrais sem entrar em expansões ainda difíceis de entender.

 

 

 

2 – Data Science do Zero: Primeiras Regras com o Python  de Joel Grus

Neste livro você aprenderá, a partir do zero, como os algoritmos e as ferramentas mais essenciais de data science funcionam. Entenderá a desempenhar bibliotecas, estruturas, módulos e stacks do data science  ao mesmo tempo que se aprofunda no tema sem precisar, necessariamente, entender de data science.

 

 

 

 

 

3 – Storytelling com Dados de Cole Nussbaumer Knaflic.

O livro reflete sobre o que significa a organização dos dados em gráficos, a quem essas informações visuais serão 

apresentadas, e dentro de qual contexto. Para a autora a visualização dos dados é o ponto onde as informações devem estar mais sistematizadas, não podendo se tornar um enigma para quem observa.

Ao longo dos capítulos o livro nos mostra processos de concepção dos elementos para a visualização de dados e traz muitos exemplos de antes e depois, ou seja, exemplos de gráficos que não transmitem corretamente a mensagem e, em seguida, uma versão alternativa onde a informação foi apresentada de forma clara e eficiente.

 

 

4 – Mãos à Obra: Aprendizado de Máquina com Scikit-Learn & TensorFlow de Aurélien Géron.

Um dos melhores livros prático sobre Machine Learning. Seja para iniciante na área ou para quem já atua e precisa de um complemento.

De maneira prática, o livro mostra como utilizar ferramentas simples e eficientes para implementar programas capazes de aprender com dados. Utilizando exemplos concretos, uma teoria mínima e duas estruturas Python, prontas para produção, o autor ajuda você a adquirir uma compreensão intuitiva dos conceitos e ferramentas na construção de sistemas inteligentes.

 

 

 

5 – Learning Geospatial Analysis with Python de Joel Lawhead

Direcionado principalmente para desenvolvedores, pesquisadores e analistas de Python que desejam executar análises geoespaciais, de modelagem e GIS com o Python.

O livro é uma ótima dica para quem deseja entender o mapeamento e a análise digital e quem usa Python ou outra linguagem de script para automação ou processamento de dados manualmente.

 

 

 

 

6 – Learning Scala Programming de Vikas Sharma

O livro foi feito para programadores que desejam se familiarizar com a Linguagem de Programação Scala para escrever programas concorrentes, escaláveis ​​e reativos. Não é preciso ter experiência em programação para entender os conceitos explicados no livro. Porém, caso tenha, isso o ajudará a aprender melhor os conceitos.

O autor começa analisando os conceitos básicos da linguagem, sintaxe, tipos de dados principais, literais, variáveis ​​e muito mais. A partir daí, o leitor será apresentado às suas estruturas de dados e aprenderá como trabalhar com funções de alta ordem.

 

7 – The man who solved the market: how Jim Simons Launched the quant revolution de Gregory Zuckerman

Em tradução livre – O homem que resolveu o mercado: como Jim Simons lançou a Revolução Quant. Um livro não técnico, conta a história de Jim Simons, um matemático que começou a usar estatísticas para negociar ações, em uma época em que todo mundo no mercado usava apenas instintos e análises fundamentais tradicionais. 

Obviamente, todo mundo ficou cético em relação a seus métodos, mas depois de anos gerenciando seu fundo de investimentos e obtendo resultados surpreendentes, as pessoas acabaram cedendo e começaram a reconhecer o poder dos chamados quant hedge funds, que desempenham um papel enorme no setor financeiro nos dias atuais.

 

 

8 – Feature Engineering for Machine Learning de Alice Zheng e Amanda Casari

Embora a Engenharia de Recursos seja uma das etapas mais importantes no fluxo de trabalho da Ciência de Dados, às vezes ela é ignorada. Este livro é uma boa visão geral desse processo, incluindo técnicas detalhadas, advertências e aplicações práticas. 

Ele vem com a explicação matemática e o código Python para a maioria dos métodos, portanto, você precisa de um conhecimento técnico razoável para seguir adiante.

 

 

 

 

9 – The book of why de Judea Pearl e Dana Mackenzie

Muitas vezes nos dizem que “a correlação não implica causalidade”. Quando você pensa sobre isso, no entanto, o conceito de causalidade não é muito claro: o que exatamente isso significa?

Este livro conta a história de como vemos a causalidade de uma perspectiva filosófica e, em seguida, apresenta as ferramentas e modelos matemáticos para entendê-la. Isso mudará a maneira como você pensa sobre causa e efeito.

 

 

 

10 – Moneyball de Michael Lewis

Esta é a história de Billy Beane e Paul DePodesta, que foram capazes de levar o Oakland Athletics, um pequeno time de beisebol, através de uma excelente campanha na Major League Baseball, escolhendo jogadores negligenciados baratos.

 

Como eles fizeram isso? Usando dados. Isso mudou a maneira como as equipes escolhem seus jogadores, o que anteriormente era feito exclusivamente por olheiros e seus instintos. A história também inspirou um filme com o mesmo nome, e ambos são obras-primas.

 

 

Fonte: crb8.org.br

 

O que achou das dicas? Que mais livros você incluiria? Compartilha com a gente!

Sair da versão mobile