O aprendizado de máquina está fora da zona de hype. E Ă© difĂcil dizer sem ambigĂĽidade o quĂŁo bom ou ruim isso Ă©, mas o que Ă© absolutamente claro - mais e mais pessoas estĂŁo perguntando “onde está o dinheiro?” Em relação aos projetos de ML. E este artigo nĂŁo será exceção - o hype acabou, precisamos trabalhar.
Se falamos sobre a construção de qualquer processo, pessoalmente gosto muito de usar o termo “nĂvel de maturidade”. Afinal, se vocĂŞ tem uma escala de avaliação compreensĂvel diante de seus olhos, vocĂŞ sempre pode entender onde está, o que o espera adiante, vocĂŞ pode decidir sobre as prioridades e começar a ajustar o que precisa aqui e agora, e nĂŁo pular alguns de nĂveis e fazer uma revolução, reinventando a roda na pechincha ... e pode nĂŁo ser Ăştil mais tarde. Em geral, um exercĂcio Ăştil de todos os pontos de vista.
Teoricamente, vocĂŞ pode pegar os nĂveis de maturidade do processo padrĂŁo descritos no CMMI, ISO / IEC 33001 ou sua descrição mais prática de TI do ITIL e mudá-los para ML. Tentei várias vezes fazer este exercĂcio na prática, mas acabou por ser uma espĂ©cie de cavalo esfĂ©rico no vácuo, que podia e dava uma resposta Ă questĂŁo atual e futura, mas era difĂcil desenhar uma caminho compreensĂvel. Portanto, olhando em volta, decidi lembrar e sistematizar meu difĂcil caminho no trabalho em vários projetos de ML, porque o CMMI Ă© bom, mas para um trabalho real vocĂŞ precisa de algo mais especĂfico e prático. De uma forma geral, como resultado, surgiu a descrição de algumas das etapas básicas de desenvolvimento dos trabalhos em projetos de ML. Se eles podem ser chamados de “nĂveis de maturidade” ou nĂŁo, Ă© a segunda questĂŁo, mas as questões acima foram respondidas e isso Ă© o mais importante.
EntĂŁo, vamos aos detalhes. Provavelmente, o Ăşnico nĂvel em que nĂŁo descobri nada novo e tirei do ITIL Ă© o nĂvel "0" ou "ausente". Como se costuma dizer, se nĂŁo há processo, entĂŁo nĂŁo Ă© de forma alguma, seja sobre TI ou sobre ML. Mas, falando sĂ©rio, meus 5 nĂveis / etapas sĂŁo os seguintes:
NĂvel 1. "Entusiastas"
NĂvel 2. "P&D"
NĂvel 3. "Analisar"
NĂvel 4. "Especialidade"
NĂvel 5 "Automatizar"
NĂvel 1 "Entusiastas"
- ( ) . , ( ), , , , «Big Data» . Python ( R Matlab … ) -- - . .
— , . , .
2 «»
- , , , . , :
– -, .., .
– . - 80% , .
ML . — , . .
3 « »
, , , . :
. ( , ), . , .
, .. -. , . . , .
. , — , ?
4. «»
, ( , ..), - . , :
- PROD- DEV/TEST/PROD
, .. – , .
– - , - . Run the business/Change the business.
5 « »
, 4- . DataOps&MLops . DVC Feature Store . .
, :
|
1 |
2 |
3 |
4 |
5 |
|
. .
|
.
|
|
.
|
100% |
|
PC/ ( +GPU) |
PC ( on-prem) |
ML- . |
PROD DEV/TEST . . |
PROD DEV/TEST . . |
|
1-2 (Data Scientists - DS) |
3-5 :2-3 DS 1-2 DE (Data Engineers) |
5-10 : 3-6 DS 2-4 DE
|
10+ . «ML-ops».
|
25+
|
- |
1-2 |
2-4 |
5+ |
10+ |
50+ |
|
|
( , ). , , . , , .
, , :
, ML? ?
?
, ?
, ML - , — .
— ( ) . , ML — Python, R, Azure ML Studio, SPSS SAS, . 1- 5- . . . , ( ), , .
Mas, na verdade, este Ă© um tĂłpico separado para discussĂŁo (ou outro artigo, se houver inspiração) - a escolha do caminho ideal de um nĂvel para outro e do que depende, quando e qual software Ă© necessário, qual expertise Ă© necessária , e onde está o lugar para a terceirização e Ă© claro - mas como determinar o ponto, quando parar.