Speakers
MinicursosJurimetria é a estatística aplicada ao direito. Aplicações de jurimetria variam desde estratégias para advogados e análise de risco de carteiras de processos até análise de impacto regulatório, elaboração de políticas públicas e administração de tribunais. Nessa palestra, apresentaremos algumas características fundamentais dessa disciplina e discutiremos os principais tópicos e desafios. Além disso, mostraremos o ferramental estatístico que temos usado para solucionar os problemas nas pesquisas mais recentes.
Bacharel, mestre e doutorando em Estatística pelo IME-USP. Secretário-geral da Associação Brasileira de Jurimetria (ABJ). Vice-presidente - CONRE-3a Região. Sócio da Curso-R Treinamentos e consultoria - Trabalha com web scraping, consolidação de dados, visualização e modelagem, construindo modelos preditivos, APIs, pacotes em R e dashboards em Shiny. Cursos: Ministrante do curso “R: do casual ao avançado” do Programa de Verão do IME-USP - 2015 a 2018 e diversos outros cursos. Público Alvo: Estatísticos, cientistas da computação, cientistas sociais/políticos. Nível intermediário de R, ambientação com RStudio e com tidyverse Dia 22/05/2018 de 14 às 17h O minicurso ajudará os participantes na construção de seus pacotes no R. O objetivo do minicurso é mostrar as etapas para a criação de pacotes do R. Ao final do minicurso, deve-se ter uma primeira versão de um pacote desenvolvido a partir de um código simples do R. Esse pacote será construído no RStudio.
Entusiasta do R de inovação. Atualmente é professor no Departamento de Métodos Quantitativos da UNIRIO, onde realiza pesquisas sobre a inovação na Gestão Pública, tecnologia e métodos quantitativos. Focado nesses métodos aplicados ao setor público, trabalha com estatística, ciência política, gestão pública, design e economia. Público Alvo: conhecimento do R - intermediário Dia 22/05/2018 de 9 às 12h A obtenção e organização de dados de fontes não-estruturadas compõe uma das habilidades do cientista de dados moderno. Neste contexto, o webscraping (raspagem de dados) constitui uma ferramenta indispensável para a extração de dados de páginas da internet quando não existe API disponível. O curso terá como foco a capacitação no pacote rvest para webscraping de páginas em HTML no formato de estudos de caso. Em associação, pacotes do tidyverse (e.g. stringr, dplyr, purrr) serão utilizados para garantir a correta extração de dados e a legibilidade do código. Finalmente, serão explorados os mecanismos do pacote de acessar e interagir com sites sem a necessidade de um navegador.
Karla Patricia Oliveira Esquerre é Professora Associada I da Universidade Federal da Bahia. É docente permanente do Programa de Pós-Graduação em Engenharia Industrial e fundadora/coordenadora do Grupo de Pesquisas Growing with Applied Modeling and Multivariate Analysis (GAMMA). Atualmente apoia o uso contínuo do R em as aulas de graduação e pós-graduação nos cursos de engenharia da UFBA e orienta alunos de iniciação científica/tecnológica, mestrado e doutorado que fazem uso intensivo deste programa. Adelmo Filho é estudante do curso de graduação em Engenharia Química da Universidade Federal da Bahia. É integrante do Grupo de Pesquisas Growing with Applied Modeling and Multivariate Analysis (GAMMA) da Universidade Federal da Bahia e fundador da LLAB, startup conectada com Data Science e Machine Learning. Atualmente, desenvolve pesquisas em temas relacionados a aprendizado de máquina, estatística multivariada, confiabilidade e ensino de estatística. Público Alvo: Estudantes, professores e interessados por estatística e programação com conhecimento básico/intermediário em R. Dia 22/05/2018 de 14 às 17h Neste minicurso, será apresentada uma breve teoria sobre modelos de regressão envolvendo desfechos politômicos de natureza nominal e ordinal, e algumas aplicações na área de saúde. Será dada ênfase na interpretação dos resultados e no cálculo de medidas de qualidade do ajuste.
Professor Adjunto do Departamento de Estatística da Universidade Federal Fluminense, com Graduação em Estatística e Mestrado em Estudos Populacionais e Pesquisas Sociais (Estatística Social) pela ENCE e Doutorado em Saúde Coletiva pela UFRJ. Vem atuando em cursos de graduação e pós-graduação (Mestrado) da UFF, ministrando disciplinas de (bio)estatística, probabilidade, amostragem probabilística e modelagem estatística, e desenvolvendo pesquisas nas áreas de Saúde Coletiva, Defesa e Segurança Civil. Público Alvo: Público interessado em modelagem estatística e no programa R, independentemente da área de atuação. Algum conhecimento sobre inferência estatística e modelos lineares é requerido. Dia 22/05/2018 de 9 às 12h Aprenda a fazer gráficos 2D e 3D usando ferramentas baseadas em OpenGL que é biblioteca padrão para gráficos acelerados por hardware. Durante o minicurso serão mostrados diversos exemplos 2D e 3D que permitem a manipulação do gráfico em tempo real.
Atua como professor adjunto na Universidade Federal Fluminense no Departamento de Geometria. Mestrado e Doutorado em Matemática pela Pontifícia Universidade Católica do Rio de Janeiro (2010), Bacharel em matemática pela Universidade Estadual de Maringá (2002). Atua na área de Machine Learning, Computação Gráfica, Modelagem Geométrica. Já atuou no desenvolvimento de projetos em colaboração com a Petrobras, EMC e DELL EMC. Trabalha com pesquisa para compressão sem perda de dados sísmicos, predição e análise de séries temporais usando Deep Machine Learning. Público Alvo: Iniciantes e intermediários Dia 22/05/2018 de 9 às 12h O desenvolvimento computacional explica o crescimento da aplicação da abordagem Bayesiana no auxílio à tomada de decisão. Mais especificamente, o programa R tem se mostrado atraente para prática de análise estatística sob abordagem Bayesiana por ser livre, de código aberto, bastante flexível e possuir uma comunidade de usuários extremamente atuante e colaborativa.
Na abordagem Bayesiana se recorre ao teorema de Bayes no processo de inferência, combinando informação obtida dos dados (verossimilhança) e das informações prévias sobre os parâmetros (prioris), resultando na posteriori. É comum a distribuição à posteriori não ter forma conhecida, assim, métodos computacionalmente intensivos devem ser empregados no processo de estimação. Neste minicurso, serão apresentados e discutidos conceitos teóricos da inferência Bayesiana, da elicitação de distribuição a priori, bem como dos métodos computacionais de Monte Carlo via Cadeia de Markov (MCMC): amostrador de Gibbs e Metropolis-Hasting. Professor adjunto do DMQ/UNIRIO, coordenador do projeto de extensão GAE-Assessoria, vice-coordenador do programa de pós-graduação em Saúde e Tecnologia no Espaço Hospitalar – PPGSTEH/UNIRIO. Doutor em Estatística pela UFRJ (2012), mestre em Agronomia com área de concentração em Estatística e Experimentação Agronômica pela ESALQ/USP (2007) e graduado em Estatística pela UNESP (2004). Tem experiência na área de Probabilidade e Estatística, com ênfase em Análise Espacial, Modelos Espaço-Temporias Bayesianos e Educação Estatística. Público Alvo: Congressistas com conhecimento básico de probabilidade, inferência estatística e programação em R Dia 22/05/2018 de 14 às 17h Os relatórios dinâmicos agregam texto e resultados de programas em R. Os relatórios são gerados em uma execução, conjuntamente com os comandos do R e, com vários recursos de edição (integrado com Latex) gera documentos em PDF, HTML, Beamer, Word e outros.Clique aqui para editar.
Estatístico com mestrado em estatística e doutorado em informática. É professor na ENCE desde 2002, quando se tornou usuário contumaz de R. Público Alvo: Interessados no tema com conhecimentos básicos de R e RStudio Dia 22/05/2018 de 9 às 12h Quais são as fontes de dados financeiros nacionais e internacionais disponíveis e como importar estes dados para o R? Serão apresentadas diversas fontes de dados financeiros disponíveis sem custo na Internet, os pacotes desenvolvidos em R para acessar estes dados e as estruturas de dados existentes para a manipulação dessa informação.
Mestre em Física pela PUC-Rio. Gerente de Modelagem de Apreçamento na B3—Brasil Bolsa Balcão. Público Alvo: Todos com interesse em R e finanças Dia 22/05/2018 de 14 às 17h |
|
PalestrasOne of the biggest pain points for both teachers and learners of data science in R is navigating the often unspoken prerequisite skills and content knowledge necessary to successfully apply R to data science problems. In this talk, R for data science educators will learn actionable strategies to more effectively bring learners up to speed, while learners will develop strategies to identify and address their own knowledge gaps. By incorporating learnings from the establishment of a data-driven culture at Teaching Trust, coupled with her experience creating and leading the R for Data Science Online Learning Community, Ms. Mostipak will share strategies that can be immediately implemented with groups of any size in order to more quickly develop data science skills in R. These include methods for identifying individual gaps in knowledge, establishing mentor and learner relationships, incorporating best practices from the field of education, and bolstering fundamental computer science skills.
Director, Data Systems & Analysis at Teaching Trust, Creator and Lead Facilitator, R for Data Science Online Learning Community Target Audience: Data science educators who teach R; Learners developing their data science skills in R Text data is increasingly important in many domains, and tidy data principles and tidy tools can make text mining easier and more effective. In this talk, Julia will demonstrate how we can manipulate, summarize, and visualize the characteristics of text using these methods and R packages from the tidy tool ecosystem. These tools are highly effective for many analytical questions and allow analysts to integrate natural language processing into effective workflows already in wide use. We will explore how to implement approaches such as sentiment analysis of texts, measuring tf-idf, and finding word vectors.
Julia Silge is a data scientist at Stack Overflow, with a PhD in astrophysics and an abiding love for Jane Austen. Julia worked in academia and ed tech before moving into data science and discovering R. She enjoys making beautiful charts, programming in R, text mining, and communicating about technical topics with diverse audiences. Target Audience: Everyone A comunidade do R sofre de uma sub-representação da mulher * em todos os papéis e áreas de participação, seja como líderes, desenvolvedores de pacotes, conferencistas, participantes de conferências ou usuários. Com uma iniciativa de diversidade, a missão do R-Ladies é conseguir uma representação proporcional incentivando, inspirando e capacitando as minorias atualmente sub-representadas na comunidade do R. O foco principal da R-Ladies, portanto, é apoiar os entusiastas de R que se identificam como uma minoria de gênero sub-representada para alcançar seu potencial de programação, construindo um rede global colaborativa de líderes em R, mentores, aprendentes e desenvolvedores para facilitar progresso individual e coletivo em todo o mundo.
Gabriela de Queiroz é Data Scientist no Vale do Silício e fundadora do R-Ladies, uma organização mundial que promove a diversidade na comunidade do R. Ela trabalhou em várias startups onde criou equipes, desenvolveu modelos estatísticos e empregou uma variedade de técnicas de Machine Learning. Nas suas horas vagas é mentora em Data Science. Ela possui 2 Mestrados: um em Epidemiologia e um em Estatística. Público-Alvo: Não é necessário nenhum nível de conhecimento do R. Ageing populations is a problem faced by many countries in the world, including Brazil. Using a nationally representative sample from the 2008 PNAD, we developed measurement models for the health and economic well-being of older people; aged 60+ years old. Clustering older individuals by sector, multilevel structural equation modelling provided greater understanding of the challenges for older people of Brazil. This allows for the development of policies that are efficient in the application of resources in the care of older people. Analyses were conducted using the MplusAutomation package in R for data formatting and estimation of the multilevel SEM in Mplus (Version 6); a commercial SEM program. Clustering individuals by sector, the model had a different structure of latent variables at the sector level. Strong associations existed between health and economic well-being and demographic variables of both individuals and sectors had significant effect on health and economic well-being.
Having recently passed my PhD at Lancaster University in a partnership scheme with Universidade Federal Fluminense, I am now at the beginning of my research career in applied social and medical statistics. The focus of the thesis was the application of measurement models in the research the care of the elderly in both England and Brazil. Target Audience: Intermediate Com o objetivo de fornecer conhecimento aos Membros, Servidores do Ministério Público e população do Estado do Rio de Janeiro a plataforma foi desenvolvida para abranger informações de setores governamentais (Estado e Municípios), organizações parceiras e prestadoras de serviços para o poder público. A demanda surgiu para atender os requisitos da política nacional de dados abertos, instituída pela Lei de acesso à Informação. O objeto do projeto se concretiza a partir de uma plataforma digital composta por painéis e mapas interativos que contemplam análises estatísticas, com a utilização do software R, dados internos e externos, bem como o georreferenciamento das informações concernentes aos serviços da instituição.
Nicole e Cristiane são Mestres em Estatística pela Pontifícia Universidade Católica do Rio de Janeiro Público Alvo: Estudantes de graduação e pós graduação; pesquisadores interessados em análise de dados This lecture will introduce the audience to package GetDFPData, which allows access to the DFP and FRE systems of B3, the Brazilian exchange. It will include example of usage and a research example with this large and rich dataset.
Marcelo Perlin holds a PhD in Finance from Reading University (ICMA Centre - UK) and is a teacher and researcher in the post-graduate program of Business Administration from Universidade Federal do Rio Grande do Sul, Porto Alegre - Brazil. With more than a decade of experience in writing software related to scientific research, Marcelo has published several CRAN packages that help the analysis of financial and economical data. More details at https://msperlin.github.io/. Target Audience: Everyone Esta palestra visa promover uma breve introdução ao tidyverse, comparando-o ao pacote base do R. Desta forma, objetiva-se identificar os pontos fortes e limitadores deste conjunto de pacotes que se apresenta como revolucionário por descomplicar a programação em R e possibilitar uma melhor curva de aprendizado desta linguagem independente do nível e da experiência anterior de programação do interessado. Espera-se com esta palestra demonstrar como as funções promovidas pelo tidyverse contribuem para a organização, limpeza e reprodutibilidade de códigos em R. Nesta palestra serão tratados os pacotes: ggplot2 (geração de gráficos), dplyr (manipulação de data), tidyr (ajuste de banco de dados), readr (leitura de banco de dados), purrr (operações em listas), tibble (armazenamento de banco de dados).
Tarssio Brito Barreto é membro do Grupo de Pesquisas em Análise Multivariada e Modelagem Aplicada (GAMMA) da Universidade Federal da Bahia e mestre em Meio Ambiente, Águas e Saneamento pelo Mestrado em Meio Ambiente, Águas e Saneamento (MAASA - UFBA) . Atualmente, desenvolve pesquisas em temas relacionados a análise de séries temporais, estatística multivariada e ensino de estatística, tendo especial interesse naqueles temas referentes a água. Público Alvo: Qualquer nível de conhecimento em R The measurement of abilities, feelings and beliefs, via statistical methods, termed psychometrics, is a large and growing field. This talk will explain the rationale behind and the utility of Item Response Theory (IRT), a specific family of psychometric model for creating continuous score variables from binary or ordinal responses to sets of test items or questionnaire questions. IRT models have distinct advantages for score creation over other scale creation methods, e.g., Classical Test Theory (CTT). Different data structures call for different types of IRT model and the presenter will briefly sketch out the landscape of this family of models. Following this there will be a discussion of how to apply the various models using various R packages. Finally, links and further reading will be suggested to enable individuals interested in applying this technique, in R, to do so.
My name is Dr Gareth McCray and I received my PhD in Applied Social Statistics from Lancaster University in 2014. My PhD concerned the measurement of cognitive processing in English Language reading comprehension. Currently, I work as a medical statistician at Keele University in the UK. The main projects I work on involve i) the cross-cultural/linguistic/national measurement of child development, ii) Sample-size simulation, using R, iii) examiner judgement matching in tests of medical competence. Target Audience: Beginner As distribuições estáveis são consideradas generalizações importantes de distribuições conhecidas, como a normal e a Cauchy. As diversas possibilidades de formas que podem assumir permitem muitas vezes uma modelagem mais refinada em aplicações práticas, principalmente quando os dados exibem comportamento leptocúrtico (caudas pesadas) e/ou assimetria. Outro aspecto de destaque é a existência de um Teorema Limite Central mais geral, envolvendo distribuições estáveis, sem suposições de existência de momentos. Um empecilho é a não existência de forma analítica fechada para a função densidade e de momentos finitos na maioria dos casos. A apresentação abordará como lidar com tais dificuldades, introduzindo procedimentos para aplicações em R e o pacote STABLE.
Bacharel e mestre pela Unicamp e doutor em Estatística pela USP. Atualmente é professor e pesquisador na ENCE/IBGE. Atua na área de Probabilidade e Estatística, com ênfase em séries temporais, econometria, modelos lineares generalizados e teoria de valores extremos. Público Alvo: Conhecimento básico de R e intermediário de probabilidade. A palestra pretende abordar o que é exigido do estudante de graduação pelo mercado de trabalho em termos de habilidades em R, enumerar possíveis soluções para o aprendizado, quais pacotes são úteis para análise de dados, mostrar a visão do estudante e como ele pode tomar atitudes em direção ao seu desenvolvimento profissional.
Jonatha Azevedo cursa Estatística na Universidade Federal Fluminense, onde foi monitor de Programação Estatística, e é estagiário na Fundação Getúlio Vargas, tendo participado da construção do pacote de séries econômicas brasileiras BETS. Leonardo Filgueira cursa Estatística na Universidade Federal Fluminense, onde foi monitor de Estatística Básica, e é estagiário no IBOPE DTM. Ambos fazem parte do projeto de extensão "Estatística é com R!" desde seu início, em 2015, além de terem feito parte da equipe que preparou o SER, em sua primeira edição. Público Alvo: Alunos que buscam o mercado de trabalho tendo o R como diferencial. Sumarizar os benefícios/desafios de implementar o shiny server como solução de aplicativos e visualização de uma empresa ainda não adaptada a cultura data-driven.
Estatístico da UERJ, com especialização em Logística pela COPPEAD/UFRJ e Pós Graduado em BigData pela INFNET. Cientista de dados especializado principalmente em modelagem de Séries Temporais e criação de ambiente e processos analíticos. Público Alvo: Estatísticos e desenvolvedores de qualquer nível com interesse em melhorar a comunicação com outras áreas de forma amigável e inovadora. Mais do que apresentar uma palestra estaremos trocando com a platéia sobre as formas de aprendizado. Em software livre todos podemos participar de seus avanços. As contribuições mais óbvias dão-se através dos pacotes, códigos aplicados em bibliotecas utilizadas no R. Porém, pode-se contribuir de diversas formas, inclusive difundindo nosso modo de aprender e ensinar o R. Venha participar e contribuir você também.
Ariel Levy é torcedor do Botafogo! Doutor em Economia (Universidade Federal Fluminense - 2013), mestre em Administração (IBMEC -2003) e engenheiro eletricista (Universidade Federal Fluminense - 1982). É professor adjunto da Universidade Federal Fluminense vinculado ao Departamento de Administração na Faculdade de Administração e Ciências Contábeis e atualmente o Coordenador do Curso de Graduação em Administração. Sou professor colaborador no PPGAd- UFF e no Curso de Especialização em Administração Pública da UFF (CEAP). Possui experiência em Administração, com ênfase em Finanças Quantitativas; Finanças Públicas; Planejamento e Controle. Vice-Coordenador dos Seminários de Estatística com R. Público Alvo: todos os participantes do SERIII Integrar as ciências passou a compor a missão do SER. Mas isso não é novidade para a estatística e a linguagem R, integrar as ciências está no seu DNA: análise de sentimentos, jurimetria, psicometria, georreferenciamento, finanças, economia, matemática, saúde, educação e muito mais...
Luciane Alcoforado é matemática com mestrado em Engenharia de Sistemas e doutorado em Engenharia Civil. Atualmente é professora associada do departamento de Estatística da UFF , diretora do DATAUFF, coordenadora do Programa Estatística é com R! e vice coordenadora do Programa de Pós Graduação em Engenharia Civil. Tem interesse em várias atividades que envolvam o software R. Dedica boa parte do tempo no desenvolvimento do projeto do evento SER. |