Há um problema bastante curioso, que há muito tempo foi incluído no folclore matemático e também se tornou um teste favorito em entrevistas. Suas condições são simples e a solução parece sugerir-se, mas não vamos tirar conclusões precipitadas. Pegue um lápis, uma folha de papel em branco, sente-se e vamos descobrir.
Qual, de fato, é a tarefa
Então, imagine que você chegou a uma cidade completamente desconhecida e o primeiro bonde que encontrou lá era o número 17. Como você pode estimar quantas linhas de bonde existem nesta cidade?
Para simplificar, considere que as rotas do bonde na cidade são numeradas sem lacunas com números de 1 a N, e inicialmente cada um desses números com chances iguais poderia ser o número do bonde que você veria primeiro.
Pela primeira vez ouvi o problema do "bonde acidental" de Nikolai Nikolaevich Vasiliev, meu amigo matemático de São Petersburgo. Em seguida, ele compartilhou comigo a observação de que, entre aqueles a quem ele contou esse problema, e depois pediu uma resposta sem hesitação, a maioria das pessoas ligou para o número 34, ou seja, " x2 " de 17. Na minha experiência, o mais extravagante foi a resposta do meu amigo com “Mechmat”: 17. Apenas uma semana depois percebi que ele foi movido pelo princípio da maximização da probabilidade, que estava dormindo em algum lugar no subcórtex de seu cérebro. Ok, mas 17 e 34, em outras palavras " x1 " e " x2 ", são respostas ingênuas e impensadas, mas qual é a resposta correta e, em geral, esse problema tem uma?
Armadilhas e o reino da fantasia
Por que vale a pena duvidar da existência de uma resposta universalmente correta? Essa ideia é fácil de chegar se você considerar vários universos simples, embora fictícios. Por exemplo, imagine que existem exatamente 30 rotas de bonde em cada cidade da Terra. "30" será a única resposta correta neste universo? Agora imagine que em outro universo existem 1000 cidades na Terra, e em 999 delas existem 30 rotas de bonde, e no restante - há exatamente 17 delas. Qual resposta será a correta desta vez e como será afetada pelo fato de cidades com São muitas 30 rotas, mas com 17 só há uma? Devo dizer desde já que é muito difícil usar aqui considerações probabilísticas, porque a pessoa que é solicitada a estimar o número de rotas não sabe se a cidade que agora está visitando foi escolhida por acaso no mapa,ou há alguma razão nesta escolha e há o cálculo de alguém.
O princípio do pessimismo matemático extremo
Apesar das dificuldades declaradas, na matemática existe um princípio com o qual se pode dar uma resposta para o nosso problema, que permanece significativo mesmo nos mundos mais bizarros.
Quando se trata de jogos, esse princípio é chamado de maximização de ganhos garantidos
e , para entender sua essência, vamos dar uma olhada em um exemplo simples.
Imagine um jogo: secretamente de você com um dos meus punhos, escondo um pequeno objeto, que seja uma ervilha seca, depois estico os braços para a frente e peço que adivinhe em qual está essa ervilha Deixe-nos ter tempo para jogar uma longa série de jogos, e inicialmente você não sabe se estou tentando vencê-lo, estou tentando sucumbir deliberadamente ou permaneço indiferente ao seu sucesso. Digamos que seu objetivo seja ganhar o máximo de jogos possível. Qual estratégia você deve seguir neste caso?
Primeiro, vamos tentar analisar as vantagens e desvantagens das seguintes quatro estratégias simples:
- Sempre escolha sua mão direita.
- Comece com a mão direita e depois escolha a mão em que a ervilha foi encontrada pela última vez.
- , , . «1» «2», , «3», «4», «5» «6» — .
- , . , «», , «» — .
Se você decidir usar a estratégia 1) e ao mesmo tempo eu sempre esconder uma ervilha em minha mão direita, todos os jogos terminarão a seu favor. Podemos dizer que o cenário do desenvolvimento do partido, em que escondo uma ervilha exclusivamente na mão direita, é o melhor para 1) . No entanto, no meu pior cenário, um cenário em que escondo uma ervilha exclusivamente na minha mão esquerda, estratégia 1), não permitirá que você ganhe um único jogo, não importa quanto tempo nosso jogo seja.
É fácil adivinhar que a estratégia 2) sofre do mesmo "vício", ou seja, no pior cenário para ela, quando eu começo com minha mão esquerda e depois alterno as mãos em cada um dos jogos seguintes, ela não permitirá que você ganhe uma única vez, por mais nossa festa durou.
Agora, vamos descer à estratégia que vem em terceiro lugar em nossa lista. Se você usá-lo, suas chances de ganhar em todos os jogos em que a ervilha estiver escondida em sua mão direita serão de 1/3, e em jogos em que a ervilha estiver em sua mão esquerda - 2/3. É claro que o pior cenário para 3) é quando tenho o hábito de esconder uma ervilha exclusivamente na mão direita. No entanto, mesmo neste caso, em qualquer conjunto de jogos suficientemente longo, cerca de um terço deles terminará em sua vitória. Teoricamente, é claro, você pode não ter sorte e nunca adivinhará a mão certa, mas na prática, digamos em um jogo de 1000 jogos, é quase impossível que o número de suas vitórias seja menor que
Se você usou a quarta estratégia da lista, então nosso jogo adquire uma característica interessante: na verdade, deixa de ser importante para você, desta vez escondi a ervilha na mão direita ou coloquei na esquerda, pois em ambas as situações suas chances de ganhar serão as mesmas e será exatamente 50%. Você pode até dizer que qualquer sequência de mãos que eu delineei onde vou esconder uma ervilha será o melhor e o pior cenário para o desenvolvimento da festa para você. Acontece que, em qualquer caso, em um lote bastante longo de jogos, cerca de metade deles deve terminar com a sua vitória. Nesse sentido, a estratégia 4) oferece as maiores garantias em comparação com todas as outras estratégias que já consideramos aqui.
O princípio de maximizar o payoff garantido prescreve que você enumere todas as estratégias possíveis do jogo, para cada uma delas calcular o valor do payoff no pior cenário para ele e declarar a estratégia ótima para a qual o valor desse payoff será o maior. Pode-se mostrar que no jogo de adivinhar a localização da ervilha, o ótimo, e não apenas o melhor da lista, é a estratégia número 4. Em essência, maximizar a vitória garantida é semelhante ao credo de vida daquelas pessoas que sempre tendem a esperar o pior, mas ainda assim tentando melhorar de alguma forma sua posição na vida.
O problema de um bonde "aleatório" assume sua forma final
Formalismo
Para usar o princípio de maximizar os ganhos garantidos, imagine que o destino está jogando um jogo com você: ele o envia repetidamente para uma cidade desconhecida localizada em algum universo desconhecido, espera até que você encontre o primeiro bonde lá e, em seguida, pergunta quanto o mesmo nesta cidade, existem apenas linhas de eléctrico. Assumiremos que sua resposta é considerada aceitável e o jogo termina a seu favor, se apenas o número que você nomeou difere menos de duas vezes do verdadeiro, tanto para cima quanto para baixo. Também assumiremos que se trata de um lote muito longo de jogos, que durará uma vida inteira.
Agora é bastante legítimo fazer a pergunta: "Qual estratégia no jogo descrito será ideal para você no sentido de que pode fornecer o número máximo de respostas aceitáveis garantidas?"
Uma análise detalhada das estratégias mais simples
Como uma "primeira batalha" com o problema recém-proposto, vamos tentar descobrir o quão boas as estratégias ingênuas " x1 " e " x2 " são para ele .
Então, o destino nos jogou em outra cidade desconhecida. Como antes, a carta
De acordo com a estratégia " x1 "
Agora, suponha que decidimos usar a estratégia " x2 ". De acordo com as regras desta estratégia, quando você vê o número do bonde
Dos espinhos às estrelas
Antes de prosseguir para a parte principal da história, onde estamos procurando estratégias ótimas, vou modificar ligeiramente as condições do problema e assumir que
Imagine que alguém tirou uma longa tira de filme fotográfico
Como um exercício simples, mostre que, apesar das condições alteradas, a estratégia " x1 " ainda garante cerca de 50%, e os estrategistas " x2 " - os mesmos cerca de 75% das estimativas aceitáveis, respectivamente, independentemente do cenário escolhido pelo destino.
Caminho longo para a perfeição
Pré-triagem
Finalmente, todos os preparativos estão concluídos e nesta seção podemos começar a procurar as estratégias ideais. Para simplificar, no entanto, não consideraremos todas as estratégias, mas nos restringiremos àquelas em que a estimativa
Imagine agora que, em um experimento, a distância do ponto de impacto da partícula até a borda esquerda do filme fosse igual a
Se analisarmos quais respostas consideramos aceitáveis, teremos outra
restrição
Fórmula de Sua Majestade
Agora vamos tentar expressar o valor do ganho garantido na forma de alguma fórmula analítica geral para uma estratégia arbitrária.
Então, no próximo experimento de registro de partículas cósmicas, um filme fotográfico de comprimento
Porque o
fig. 1
Agora é fácil descobrir que o valor máximo
ou em mais detalhes:
Deve ser óbvio que o pior para
Podemos agora argumentar que qualquer estratégia ideal deve maximizar
Assim, o problema de encontrar estimativas ótimas foi reduzido à questão de como a função se parece
o máximo na classe de todas as funções contínuas fortemente crescentes definidas
no intervalo
A arte do raciocínio plausível
Talvez a coisa mais simples para começar seja descobrir qual função da forma
Como você pode ver,
Agora vamos pensar no que acontece se medirmos a distância não em centímetros, mas, digamos, em metros, polegadas ou anos-luz - como então a forma da função mudará
Deixe a estimativa em centímetros
Em geral, vamos lidar com a escala de comprimento
A forma da última equação indica que as funções
Você acha que é plausível que nós e alguns representantes de uma civilização cósmica distante recebamos respostas diferentes para o problema que está sendo resolvido aqui apenas porque temos unidades diferentes de medida de comprimento? Provavelmente não! Portanto, segue-se que para qualquer
Veja o que acontece: se todas as nossas muitas suposições estiverem corretas, a função ideal
Conclusões rigorosas: Otimização de x2
Ok, temos muitas dicas de que a estimativa dada pela função
Tome uma função arbitrária contínua estritamente crescente
Figura: 2
Se o gráfico de função
Agora não é mais difícil mostrar que a função
Vou começar com duas observações preliminares:
, tão
ou seja, o gráfico da função
não está acima do gráfico
- valor valor
não depende de
e é igual
, derivado
em todos os pontos é
...
Para chegar a uma contradição mais tarde, vamos primeiro assumir que
Para alguns
Desde a derivada
fig. 3
Ao mesmo tempo, você precisa se lembrar que os vértices da polilinha
Conclusões rigorosas: singularidade
O que acontecerá se, na prova que acabamos de apresentar, construirmos uma linha quebrada ao longo de tal sequência de vértices, que, em vez de se afastar infinitamente do eixo
Suponha que haja uma função
Figura: 4
Vamos denotar o símbolo
- no ponto
valor
corresponde ao valor da função
- derivado
com tudo
é o mesmo e igual
Vamos ver como os valores das funções mudarão.
Porque o
Questões de discussão
Tente adaptar independentemente a solução do problema da "partícula aleatória" às condições do problema do "bonde aleatório". Qual é o seu resultado?
Imagine que estamos resolvendo o problema de uma "partícula aleatória" em um universo onde o filme
não pode ser menor que 10 centímetros. Mostre que essas condições estimam
Há muitas reclamações sobre o princípio de maximizar os ganhos garantidos se for sabido que seu oponente não deseja derrotá-lo. Este princípio, por exemplo, dificilmente pode ser considerado justificado quando uma festa de jogos é jogada “contra” as condições meteorológicas ou “contra” o mercado de ações mundial. Que princípios de seleção de estratégias nesses casos você poderia sugerir em vez disso, quais deles são aplicáveis ao problema do "bonde aleatório"?
Eu ficaria feliz em ver seus pensamentos e comentários.
Sergey Kovalenko
2020
magnolia@bk.ru