We commonly find different data sources with a shared character variable as a key (for example, city names). Often, these character columns do not match due to typos. In this post I will use the Levenshtein distance as a tool to pair strings from two different data sources. This post was driven by a demand I received last week when I had two datasets and a simple task: “Merge it!

Continue reading

Sometimes in statistics we work with unknown probability distributions and/or the pdf’s evaluatation is computationally expensive. The ARS method arises as a way to solve this problem. Its biggest advantage is the small number of evalutions of \(h(x)\), where \(h(x)\) is the logarithm of the pdf of interest \(f(x)\) (normalized or not). The idea is to use indirect simulation to sample from a log-concave and univariate distribution (ARS needs this two assumptions).

Continue reading

base e stringr: Trabalhando com expressões regulares para manipular strings Neste post irei escrever e exemplificar o uso de expressões regulares em possíveis situações bem como a sua utilização dentro do R. Para isso escolhi apresentar o pacote stringr além de algumas funções básicas contidas na base do R (base). Para conhecer a potencialidade das funções do pacote stringr e do base é necessário um bom conhecimento a respeito de expressões regulares.

Continue reading

Introduction Neste tutorial trabalharemos aspectos básicos de programação em paralelo utilizando o software R. Para isso, serão necessários os pacotes doParallel e foreach para programação utilizando os processadores da máquina, e para a programação utilizando uma placa gráfica (GPU) traremos alguns aspectos introdutórios. Parallel computation O assunto computação paralela data de 1958 quando John Cocke e Daniel Slotnick discutiram o uso do paralelismo para cálculos numéricos pela primeira vez na IBM.

Continue reading

Este post foi editado em 06/02/2022. História e outros blá blá blás… Highsoft é o nome da empresa Norueguesa criadora da biblioteca Highchart. Segundo a própria empresa, a biblioteca é escrita puramente em JavaScript e é a mais popular do mundo (D3?). A primeira versão da biblioteca data de 1995 e dentre alguns produtos interessantes da empresa está a edição de gráficos na nuvem (para não programadores).

Continue reading

Author's picture

Douglas Mesquita

R/Shiny developer at Appsilon

Software developer

Brazil