Neste artigo, apresento os cursos e livros que me parecem os mais adequados para o aprendizado de machine learning / ciência de dados do zero. Procuro dar uma lista que seja a mais curta possível e ao mesmo tempo dar todo o conhecimento necessário para começar na prática, sem lacunas graves de conhecimento.
aviso Legal
Você pode entender no que essas recomendações se baseiam lendo os artigos anteriores, que descrevem meu caminho e os princípios do auto-estudo, bem como considerações gerais sobre como construir os estágios de aprendizagem:
Artigos anteriores
As diretrizes deste artigo ficarão desatualizadas e, com certeza, agora existem excelentes cursos e livros que poderiam ser incluídos nele. Mas esses são pelo menos alguns dos melhores materiais sobre seus tópicos. Para elaborar essa lista, foram descartados dezenas de cursos e livros, que também visam aprender do zero, mas são piores na apresentação de conceitos fundamentais.
As diretrizes não cobrem todas as habilidades técnicas potencialmente necessárias. Para ter uma ideia de tudo o que provavelmente precisa ser dominado, consulte Aprendendo a ciência de dados do zero: marcos e marcos.
Não estou citando materiais sobre redes neurais porque, na maioria dos casos, considero ineficaz começar a aprender com elas ou estudá-las nos estágios iniciais de autoaprendizagem.
Habilidades básicas necessárias
Conhecimento básico de programação: Python e SQL
É impossível fazer aprendizado de máquina ou ciência de dados sem proficiência em programação em Python ou R (é melhor começar com Python). Além disso, a grande maioria das vagas em aprendizado de máquina "clássico" (solução de problemas de negócios e trabalho inicial com dados numéricos / estatísticos) exigirá conhecimento de SQL. Para obter orientações básicas sobre como aprendê-los, consulte Autoaprendizagem em ciência de dados, De zero a sênior em dois anos .
Matemáticas
. , , , .
, - : ( ), (, , , ), , .
: . , 2 3 . 2 3 , . Math for machine learning, London Imperial College.
( , ), , : Robert Ghrist. . coursera.org, stepik.org
,
Datasmart ( ) - . , data science. , , . , python, pandas, scikit-learn - ( , .. ).
. . ( , .. , , ). - (). , .
— 8 , 2 — seaborn ( , ).
Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking, by Foster Provost ( ) - , , . Datasmart, . " " () . , ..
, - , / - . .
, , , . . , .. , , . . , .
" " - , . -, . , . Python, Pandas, scikit-learn.
- , Python. Applied DS with Python ( 1 3. 2, 4 )
, ( jupyter, pandas). , , . , - .
https://stepik.org/course/4852/syllabus
« » ( " " ). 3 , , 1 , . , ; . 4 , , , , .. , .
Kaggle : ( ) , , , ( .. ). - , , , .
scikit-learn - . , .. .
pandas, - , . , . , .
Python python standard library - . , . , collections itertools
-
( ). . , , : https://www.coursera.org/learn/competitive-data-science. kaggle - .
,
- . - -.
, - , Goodhart's law. .
/
, , https://towardsdatascience.com; 3 .
Statistics Done Wrong .The woefully complete guide by Alex Reinhart - . .
Python Machine Learning, by Sebastian Raschka - , . .
, - .
Git - . - Ry's Git tutorial. git. : http://ndpsoftware.com/git-cheatsheet.html
https://www.practicaldatascience.org/ - . , , , ( Cloud , .. , ).
?
. , , - , - /, , , , - , . - .
/
, , , .
, - self.development.mentor gmail.com,
Alguns perceberam que era melhor para eles irem para outra área (programação, big date), alguns conseguiram ajustar o currículo / plano de carreira para as necessidades individuais, alguns eu aconselhei quem poderia melhor ajudá-los, e salvei alguém (? ) De tempo gasto ineficaz para projetos sem saída.
E se meus artigos são úteis para você, você também pode me motivar financeiramente para artigos futuros, neste artigo deve haver um botão "doar" para esses fins.