Vade mecum de Estatística e Ciência de Dados

 A Ciência de Dados (Data Science) está intimamente ligada à Estatística, sendo praticamente impossível dissociar uma da outra. É, portanto, a Estatística a principal ferramenta para o pesquisador reduzir a quantidade de dados, por meio de técnicas de Machine Learning (Aprendizado de Máquina) e interpretá-los. Por isso, neste blog pretende-se construir aos poucos um pequeno vade mecum contendo os principais conceitos e conteúdos da Estatística e da Ciência de Dados, porém de forma condensada. À medida do possível, vamos disponibilizar referências, caso o leitor queira ampliar seus conhecimentos do tópico tratado.



A Estatística está firmada no uso de técnicas para obter, organizar, resumir, analisar e interpretar dados de fenômenos que envolvem características variáveis. Ora, esses objetivos também estão presentes na Ciência de Dados, que acrescenta à Estatística poderosas ferramentas de Machine Learning.

 

Referências:

Belfiore, P.; Favero, L. P. 2017. Manual de Análise de Dados: Estatística e Modelagem Multivariada com Excel®, SPSS® e Stata®. Grupo GEN. Rio de Janeiro, RJ. Brasil.

Maluf de Lima, L. 2021. Estatística Aplicada. 1 ed. Pecege Editora. Piracicaba, SP. Brasil.

Expoentes e Logaritmos no R

 

Aula: Expoentes e Logaritmos

Prof. José Fernando da Silva

2023-01-05

R Markdown

Na exponenciação, ou seja, nas operações com expoentes, estamos acostumados a usar, por exemplo,

5² = 25, onde o 5 é a base, o 2 é o expoente e o 25 é a potência. No R se escreve assim: 5^2 = 25.

No R não se usa a vírgula e sim o ponto para separar a parte inteira das decimais de um número.

No caso de logaritmos, temos que buscar essa função no R, digitando log. O próprio R vai sugerir formas de se usar a função log. Caso se queira calcular o logaritmo de 100, por exemplo, se digitar log (100), o resultado será o logaritmo natural.

O logaritmo natural tem a base e, número irracional de valor aproximado de 2.718281828459045235360287.

Assim, ao digitarmos log(100), o resultado aproximado será 4.605 e não o 2 como era de se esperar, caso a base fosse 10. Na prática, para não fazermos confusão, usamos para os logaritmos naturais o operador ln, mas o R não reconhece essa notação.

Outra confusão que se faz é chamar o logaritmo natural de logaritmo neperiano, o qual tem por base o a de valor 1/e. Exemplos:



1) Exponenciação:

3^2 

[1] 9

3**2

[1] 9

5^2

[1] 25

5^3

[1] 125

2) logaritmo natural:

log(100)

[1] 4.60517

log(2.718281828459045235360287)

[1] 1

3) logaritmo na base 10:

log10(100)

[1] 2

log10(10)

[1] 1

4) logaritmo na base 2:

log2(2)

[1] 1



As quatro operações básicas no R

 Observe na figura abaixo que não há dificuldade alguma em se realizar as quatro operações básicas no R, desde que se respeite os sinais operadores:

Adição =  +

Subtração =  -

Multiplicação =  *

Divisão =  /

Uma observação importante é que o R respeita a ordem das operações. Assim:

7*2+1 = 15, ou seja, primeiro a multiplicação e depois a adição.

Caso não seja isso que se pretenda, usamos os habituais separadores:

7*(2 + 1) = 21, por exemplo. 

No Script você digita a operação desejada e ao comandar Ctrl Enter o resultado aparece no Console. Veja a figura.




Como criar um Script no R

 Para criar um Script no R:

1) Acesse File;

2) Vá até New File;

3) Clique em R Script.

Para salvar o Script, basta o Ctrl S 



Como modificar a aparência do R Studio

 Para várias finalidades, como por exemplo, economia de energia, para evitar cansaço visual, ou até mesmo por uma questão estética, a aparência do R pode ser modificada da seguinte maneira:

 1) Acesse Tools na barra superior do R Studio;

2) Vá até Global Options;

3) Acesse Appearance;

4) Escolha a opção de tela, tipo e tamanho da fonte e salve a modificação.