Essa é uma questão relevante para qualquer tipo de desenvolvimento e o aprendizado de máquina (ML) não é exceção. Mas ao mesmo tempo, com certeza, muitos perguntarão - por que este artigo é necessário, como o seu ML difere tanto do desenvolvimento padrão, de acordo com o qual os artigos já foram escritos de forma estranha - leia, analise e escolha o caminho certo .
Por um lado, do jeito que está - e há muitos artigos para analisar e analisar. Por outro lado, há uma especificidade - e o estágio de desenvolvimento de ML é um pouco diferente do padrão e o trabalho não vai apenas (e nem tanto) com o código, mas com os dados.
Mas vamos fazer tudo passo a passo - vamos repassar as diferenças em poucas palavras, e então descobriremos se há um lugar para terceirização no desenvolvimento de ML e o que é.
Em vez de uma introdução, algumas palavras sobre as diferenças
Na verdade, a principal especificidade do desenvolvimento de ML é que não é o código que governa, mas os dados. Claro, há também uma especificidade de que não escrevemos algoritmos de ML, mas apenas usamos (treinar), mas isso, novamente, é em grande parte sobre dados. E o que nós temos? Isso mesmo - os dados são principalmente um ativo estratégico de uma empresa. E, em geral, o ML nada mais é do que o processo de monetizar esse ativo tão estratégico. E quantos estão prontos para dar a monetização de seu ativo “para o lado”?
Uma analogia engraçada veio à mente ... há uma frase famosa - "Dados são o petróleo do século 21". Então, se continuarmos com essa analogia, o ML é uma refinaria de petróleo. E é claro que você pode encontrar produtores de petróleo que vendem petróleo bruto, mas a maior parte ainda refina e vende o produto já refinado.
Além disso, é claro, não se esqueça de que os dados em muitas empresas são informações que contêm segredos comerciais / pessoais / médicos (sublinhe ou exclua as informações necessárias) e isso também impõe uma série de restrições ou, pelo menos, requer maior atenção.
, “ , , !”. . , , ML - . , .
1 -
, ML , ? , , , - . , , - - . , , . , "" ( ).
“ ?” - . , . . , , ( ), . .
- ML . - - PoC (Proof of Concept). ( CRISP-DM):
0 - . . - .
1 - . , . - , , , .. , .
2 - . . , . .
3 - . - . ML, “ ”.
4 - . :
ML
.
- ML DSaaS (DataScience as a Service), . - - . … .
2 - -
. ML , ? - . , “ ” , . ( ), . , ML - . . , . -, , , , , :
( )
, -
ML , . , - - .
, , , . . - - . , :
, :
- , ?
- - ,
- - , , ( )
- - , , , .
, . :
- . ?
( ) , .
- - - . ?
- //
, ,
/ , “ ” “”, “ .. ”, . - ML , “ ”, " " “ ” ( , , ..) .
, - :
- , . ML - , “ ”.
- , . ML - . .
, :
ML,
- PoC , -
-