Saturday 26 August 2017

Machine Learning Forex 2012


Tucker Balch Background Estou disponível para assessorar os estudantes de pós-graduação em residência na Georgia Tech em projetos relacionados ao financiamento e à aprendizagem mecânica, e rastreamento e análise do comportamento dos agentes múltiplos. Trabalho com alunos em projetos de interesse comum que culminam em um artigo publicado ou projeto de software significativo. Teremos que trabalhar juntos por vários semestres. Exijo que você tome um dos meus cursos e faça bem antes de embarcar em pesquisas juntas. Estagiários e estudiosos visitantes Eu não tenho financiamento para apoiar estagiários ou estudiosos visitantes, no entanto, eu assumir estagiários que atendem aos seguintes critérios: Um conhecimento de fundo e pesquisa que alinha com o que eu faço (principalmente ML para finanças). 3 cartas de referência. Capacidade de permanecer na residência no Georgia Tech por pelo menos 6 meses. Capacidade de cobrir todos os custos de viagem e residência em Atlanta. Se você está interessado em trabalhar comigo e conhecer os critérios acima, não hesite em me contatar. Outono de 2015, Primavera de 2016, Outono de 2016: CS 7646: Aprendizado de Máquinas para Negociação. Neste curso, aprendemos sobre muitos dos desafios técnicos envolvidos na execução de uma operação de negociação proprietária baseada em aprendizado de máquinas. Será uma experiência de codificação bastante intensiva. Saiba mais sobre este curso. Este curso será oferecido no Outono de 2015 via Udacity, e em residência no Georgia Tech, em Atlanta. Anteriormente: Outono de 2014, outono de 2013, outono de 2012. Verão de 2016: David Byrd estará ensinando o curso no verão de 2016. Outono de 2015, outono de 2016: CS 3651: The Art of Prototyping Intelligent Appliances. Nós construímos artefatos com computadores neles. Saiba mais sobre este curso. Anteriormente: Outono de 2014, 2008. Primavera 2017: CS 7631: Autonomous Multirobot Systems. Neste curso, analisamos pesquisas seminais e novas em sistemas multirobot com apresentações de pesquisa por parte dos alunos. Os alunos constroem sistemas multirobot simulados, estudam-nos e relatam sobre eles. Saiba mais sobre este curso. Este curso provavelmente será ensinado próximo por mim na primavera de 2017. Anteriormente: 2012. Investimento computacional, parte I (via coursera) Neste curso, apresento os alunos aos dados e algoritmos utilizados pelos hedge funds, bancos de investimento e outros investidores sofisticados para Gerenciar seus fundos. Corresponde aproximadamente ao primeiro 1 2 do CS 7646. Saiba mais sobre este curso. Outras atividades com Maria Hybinette. Criou o ThinkAI, um algoritmo intra-dia de previsão do preço das ações que é executado na plataforma do cliente de varejo thinkorswims. ThinkAI foi mencionado especificamente no artigo de Barrons, anunciando que thinkorswim era a 1 plataforma de alta tecnologia para negociação em 2009. Isso funciona sim. Vice-presidente da Federação RoboCup. Minhas principais responsabilidades como VP são ajudar a projetar e gerenciar as operações financeiras da RoboCup, especialmente para a filial dos EUA. E para suportar as várias necessidades de TI do RoboCup, como o site e as listas de e-mail. Ainda sou tesoureiro da filial dos EUA. Presidente da Georgia Robotics. Um sem fins lucrativos que fabrica e vende robôs para educação. Até agora, entregamos mais de 3.000 robôs a estudantes e escolas. Esse é um recorde de robôs para educação CS. Veja meu blog sobre financiamento quantitativo. Minha pesquisa foi possível por vários estudantes finos: Mert Cosgun Adam Feldman, PhD Georgia Tech, agora no Google Harikrishna Narayanan, MS Georgia Tech, agora no Yahoo Finance Shreyas Joshi, MS Georgia Tech, agora no AQR Capital Keith OHara, PhD (em breve) Georgia Tech, agora no Bard College Matt Powers, PhD Georgia Tech, agora na CMU NREC Sanem Sariel. PhD Istanbul Technical University, agora professora da UIT Rohit Sharma, MS Georgia Tech, agora vice-presidente da Morgan Stanley Ashley Stroupe. PhD CMU, agora no JPL James Bruce, PhD CMU, agora no Google Max Dama, graduação na UCB Rosemary Emery, PhD CMU, agora no Google Andrew Guillory, estudante de doutorado na UW Martin C Martin. PhD CMU, agora um empresário em série Hank Wilde, BS CS Georgia Tech, agora na CMU NREC Zia Khan, PhD (em breve) Princeton, no mercado de trabalho Jinhan Lee, estudante de doutorado na Georgia Tech Charles Pippin, estudante de doutorado na Georgia Tech e em GTRI Ram Ravichandran, BS CS Georgia Tech, agora em CMU e Twitter Richard Roberts, estudante de doutorado na Georgia Tech Andrew Stein. PhD CMU, agora em Tandent Envie-me um e-mail com correções ou atualizações :-). Minha esposa Maria é professora de informática na UGA. Gunnar, Tucker e Emmy correm por todo o lado e estudam muito para as fotos escolares da família por Maria Hybinette. Não tenho muita certeza, se esta pergunta entrar aqui. Comecei recentemente, lendo e aprendendo sobre aprendizagem de máquinas. Alguém pode lançar alguma luz sobre como ir sobre isso ou melhor, alguém pode compartilhar sua experiência e algumas dicas básicas sobre como ir sobre isso ou, pelo menos, começar a aplicá-lo para ver alguns resultados de conjuntos de dados Como é ambicioso isso soa. Além disso, mencione sobre Algoritmos padrão que devem ser experimentados ou examinados ao fazer isso. Perguntei 11 de fevereiro às 18:35 Parece haver uma falácia básica que alguém pode vir junto e aprender alguma aprendizagem em máquina ou algoritmos AI, configurá-los como uma caixa preta, ir e sentar-se enquanto eles se aposentam. Meu conselho para você: Saiba as estatísticas e o aprendizado da máquina primeiro, e então se preocupe com a forma de aplicá-los a um determinado problema. Não há almoço grátis aqui. A análise de dados é um trabalho árduo. Leia The Elements of Statistical Learning (o pdf está disponível gratuitamente no site), e não comece a tentar construir um modelo até que você entenda pelo menos os primeiros 8 capítulos. Depois de entender as estatísticas e o aprendizado da máquina, você precisa aprender a testar e construir um modelo de negociação, responsável pelos custos de transação, etc., que é uma outra área. Depois de ter um controle sobre a análise e as finanças, então será um pouco óbvio como aplicá-lo. O ponto inteiro desses algoritmos está tentando encontrar uma maneira de ajustar um modelo aos dados e produzir baixa tendência e variância na predição (ou seja, que o treinamento eo erro de previsão do teste serão baixos e similares). Aqui está um exemplo de um sistema comercial usando uma máquina de vetores de suporte em R., mas basta ter em mente que você estará se fazendo um grande desserviço se você não gastar o tempo para entender o básico antes de tentar aplicar algo esotérico. Apenas para adicionar uma atualização divertida: recentemente encontrei esta tese de mestrado: uma nova estrutura de negociação algorítmica aplicando evolução e aprendizado de máquinas para otimização de portfólio (2012). É uma revisão extensa de diferentes abordagens de aprendizado de máquinas em comparação com a compra e retenção. Após quase 200 páginas, eles alcançaram a conclusão básica: nenhum sistema de negociação foi capaz de superar o benchmark ao usar os custos de transação. Escusado será dizer que isso não significa que não pode ser feito (eu não passei a qualquer momento revisando seus métodos para ver a validade da abordagem), mas certamente fornece mais evidências a favor do teorema do almoço sem reservas. Respondeu 11 de fevereiro às 18:48 Jase Como um dos autores da tese de mestrado mencionada, posso citar o meu próprio trabalho e dizer: "Se alguém realmente consegue resultados lucrativos, não há incentivo para compartilhá-los, pois negaria sua vantagem." Embora nossos resultados possam dar suporte à hipótese do mercado, isso não exclui a existência de sistemas que funcionem. Pode ser como a teoria da probabilidade: é especulado que avanços no campo da teoria da probabilidade aconteceram várias vezes, mas nunca foram compartilhados. Isso pode ser devido à sua aplicação prática no jogo. Então, novamente, talvez esta seja a alquimia moderna. Ndash Andr233 Christoffer Andersen 30 de abril 13 às 10:01 Meu conselho para você: Existem vários ramos de Aprendizagem Artificial de Aprendizado de Máquinas (ML AI) lá fora: www-formal. stanford. edu jmc whatisai node2.html Eu tentei apenas a programação genética e Algumas redes neurais, e eu pessoalmente acho que o ramo da aprendizagem por experiência parece ter o maior potencial. O GP GA e as redes neurais parecem ser as metodologias mais comumente exploradas para fins de previsões do mercado de ações, mas se você fizer alguma mineração de dados em Predict Wall Street. Você também poderá fazer algumas análises de sentimentos. Passe algum tempo aprendendo sobre as várias técnicas de ML AI, encontre alguns dados de mercado e tente implementar alguns desses algoritmos. Cada um terá seus pontos fortes e fracos, mas você pode combinar as previsões de cada algoritmo em uma previsão composta (semelhante ao que os vencedores do Prêmio NetFlix fizeram). Alguns recursos: Aqui estão alguns recursos que você pode querer procurar: The Chatter: O consenso geral entre os comerciantes é que a Inteligência Artificial é uma ciência voodoo, você não pode fazer um computador prever os preços das ações e você tem certeza de perder seu dinheiro se você tentar Fazendo. No entanto, as mesmas pessoas vão dizer-lhe que apenas a única maneira de ganhar dinheiro no mercado de ações é construir e melhorar a sua própria estratégia comercial e segui-la de perto (o que na verdade não é uma má idéia). A idéia de algoritmos AI não é construir Chip e deixá-lo negociar para você, mas para automatizar o processo de criação de estratégias. É um processo muito tedioso e, de modo algum, é fácil :). Minimização de superposição: como já foi ouvido antes, uma questão fundamental com os algoritmos de AI é a sobreposição (também conhecido como viés de datamining): dado um conjunto de dados, seu algoritmo AI pode encontrar um padrão particularmente relevante para o conjunto de treinamento. Mas pode não ser relevante no conjunto de teste. Há várias maneiras de minimizar a superposição: use um conjunto de validação. Não dá feedback ao algoritmo, mas permite que você detecte quando seu algoritmo está potencialmente começando a superar (ou seja, você pode parar de treinar se você estiver superando demais). Use a aprendizagem em linha da máquina. Ele elimina em grande parte a necessidade de back-testing e é muito aplicável para algoritmos que tentam fazer previsões de mercado. Ensemble Learning. Fornece uma maneira de tomar vários algoritmos de aprendizado de máquina e combinar suas previsões. O pressuposto é que vários algoritmos podem ter superado os dados em alguma área, mas a combinação correta de suas previsões terá melhor poder preditivo. Dois aspectos da aprendizagem estatística são úteis para a comercialização. Primeiro, os mencionados anteriormente: alguns métodos estatísticos focados no trabalho em conjuntos de dados ao vivo. Isso significa que você sabe que está observando apenas uma amostra de dados e que deseja extrapolar. Você, portanto, tem que lidar com problemas de amostragem e sem amostras, superação e assim por diante. A partir deste ponto de vista, a mineração de dados é mais focada em conjuntos de dados mortos (ou seja, você pode ver quase todos os dados, você tem um problema apenas na amostra) do que a aprendizagem estatística. Como o aprendizado estatístico é sobre o trabalho no conjunto de dados ao vivo, as matemáticas aplicadas que lidam com eles tiveram que se concentrar em um problema de duas escalas: amplificador X X amp. Ftheta (Xn, xi) ampamp L (pi (Xn), n) final direito. Onde X é o espaço de estado (multidimensional) para estudar (você tem nelas suas variáveis ​​explicativas e as que predizem), F contém a dinâmica de X que precisa de alguns parâmetros theta. A aleatoriedade de X vem da inovação xi, que é i. i.d. O objetivo do aprendizado estatístico é construir uma metodologia, como entradas uma observação parcial pi de X e ajustar progressivamente uma estimativa de hattheta de theta, para que possamos saber tudo o que for necessário no X. Se você pensa em usar a aprendizagem estatística para encontrar Os parâmetros de uma regressão linear. Nós podemos modelar o espaço de estado como este: underbrace yx end right) left start a amp b amp 1 1 amp 0 amp 0 end right cdot underbrace x 1 epsilon end right) o que permite observar (y, x) n em qualquer n Aqui theta (a, b). Então você precisa encontrar uma maneira de construir progressivamente um estimador de theta usando nossas observações. Por que não uma descida de inclinação na distância L2 entre y e a regressão: C (hat a, hat b) n sum (yk - (hat a, xk hat b)) 2 Aqui gamma é um esquema de ponderação. Normalmente, uma boa maneira de construir um estimador é escrever corretamente os critérios para minimizar e implementar uma descida de gradiente que produza o esquema de aprendizagem L. Voltando ao nosso problema genérico original. Precisamos de algumas matemáticas aplicadas para saber quando os sistemas dinâmicos de casal em (X, hattheta) convergem, e precisamos saber como construir esquemas de estimativa L que convergem para a teta original. Para dar-lhe indicações sobre esses resultados matemáticos: agora podemos voltar ao segundo aspecto da aprendizagem estatística que é muito interessante para os estrategistas quantos comerciantes: 2. Os resultados utilizados para provar a eficiência dos métodos de aprendizagem estatística podem ser usados ​​para provar a eficiência Dos algoritmos de negociação. Para ver isso, basta ler de novo o sistema dinâmico acoplado que permite escrever o aprendizado estatístico: M ampamp esquerdo ampère (Mn, xi) amplificador L (pi (Mn), n) final direito. Agora M são variáveis ​​de mercado, rho é PnL subjacente, L é uma estratégia de negociação. Basta substituir minimizar um critério ao maximizar o PnL. Veja, por exemplo, a divisão ótima de pedidos em pools de liquidez: uma abordagem de algoritmo stochatico por: Gilles Pags, Sophie Laruelle, Charles-Albert Lehalle. Neste artigo, os autores mostram quem usará essa abordagem para dividir de forma otimizada um pedido em diferentes pools escuros simultaneamente, aprendendo a capacidade dos pools para fornecer liquidez e usando os resultados para negociar. As ferramentas de aprendizagem estatística podem ser usadas para construir estratégias de negociação iterativas (a maioria delas é iterativa) e provar sua eficiência. A resposta curta e brutal é: você não. Primeiro, porque ML e Statistics não é algo que você pode controlar bem em um ou dois anos. O meu horizonte de tempo recomendado para aprender algo não-trivial é de 10 anos. Não seja uma receita para ganhar dinheiro, mas apenas outro meio para observar a realidade. Em segundo lugar, porque qualquer bom estatístico sabe que a compreensão dos dados eo domínio do problema é de 80 do trabalho. É por isso que você tem estatísticos que se concentram na análise de dados da Física, na genômica, no sabermetrics etc. Para o registro, Jerome Friedman, co-autor da ESL citada acima, é um físico e ainda possui uma posição de cortesia no SLAC. Então, estude estatísticas e finanças por alguns anos. Seja paciente. Siga seu próprio caminho. O quilometragem pode variar. Respondeu 9 de fevereiro às 4:41 eu concordo totalmente. Só porque você conhece o aprendizado da máquina e as estatísticas, isso não implica que você saiba como aplicá-lo para financiar. Ndash Dr. Mike 10 de agosto 11 às 20:25 Também é importante lembrar que você não deve negociar contra pessoas, você estará negociando contra outros algoritmos de inteligência artificial que estão observando seus negócios, e estão calculando furiosamente as chances de que o O ataque coletivo seria assustado por um declínio fabricado e levando aquela pequena perda na criação de um mergulho de pico e enganar todos aqueles AI39s para parar e, em seguida, rolando o mergulho de volta para ele e montar a onda, ganhando suas perdas. O mercado de ações é um jogo de soma zero, trate-o como entrar em uma partida profissional de boxe, se você não tiver um veterano de 20 anos, você vai perder o ndash Eric Leschinski 13 de fevereiro às 1:56 Uma aplicação básica é a previsão de sofrimento financeiro. Obter um monte de dados com algumas empresas que falharam, e outras que não têm, com uma variedade de informações e índices financeiros. Use um método de aprendizagem de máquina, como SVM, para ver se você pode prever quais empresas serão padrão e quais não serão. Utilize esse SVM no futuro para empresas com inadimplência baixa de baixa probabilidade e empresas de baixa inadimplência de baixa probabilidade, com o produto das vendas a descoberto. Há um quot dizendo quilo de centavos na frente de rolos de vapor. Você está fazendo o equivalente a vender uma venda fora do dinheiro. Neste caso, você ganhará pequenos lucros por anos, então ficará totalmente limpo quando o mercado derreter a cada 10 anos ou mais. Há também uma estratégia equivalente que compra dinheiro fora do dinheiro: eles perdem dinheiro há anos, e depois fazem uma matança quando o mercado derrete. Veja Talab39's The Black Swan. Ndash Contango 5 de junho às 22:20 Lembre-se de que as empresas internacionais gastaram centenas de bilhões de dólares e horas-homem nas mentes de inteligência artificial melhores e mais brilhantes nos últimos 40 anos. Eu já falei com algumas das torres mentais responsáveis ​​pelos alphas em Citadel e Goldman Sachs, e a arrogância dos noviços para pensar que eles podem montar um algoritmo que irá toe to toe com eles, e vencer, é quase tão tolo quanto Uma criança dizendo que ele vai pular para a lua. Boa sorte, garoto, e cuidado com os marcianos espaciais. Para não dizer, novos campeões podem ser feitos, mas as chances são contra você. Ndash Eric Leschinski 13 de fevereiro às 2:00 Uma possibilidade que vale a pena explorar é usar a ferramenta de aprendizado de ferramentas vetoriais de suporte na plataforma Metatrader 5. Em primeiro lugar, se você não estiver familiarizado com isso, o Metatrader 5 é uma plataforma desenvolvida para que os usuários implementem negociação algorítmica em mercados de Forex e CFD (não tenho certeza se a plataforma pode ser estendida a ações e outros mercados). Normalmente, ele é usado para estratégias baseadas em análise técnica (ou seja, usando indicadores baseados em dados históricos) e é usado por pessoas que buscam automatizar suas negociações. O Support Vector Machine Learning Tool foi desenvolvido por uma comunidade de usuários para permitir que máquinas de vetor de suporte sejam aplicadas a indicadores técnicos e aconselhar sobre negócios. Uma versão de demonstração gratuita da ferramenta pode ser baixada aqui se você quiser investigar mais. Como eu entendo, a ferramenta usa dados de preços históricos para avaliar se os negócios hipotéticos no passado teriam sido bem sucedidos. Em seguida, leva esses dados juntamente com os valores históricos de uma série de indicadores personalizáveis ​​(MACD, osciladores, etc.) e usa isso para treinar uma máquina vetorial de suporte. Em seguida, ele usa a máquina de vetor de suporte treinado para sinalizar futuros negócios de venda de compras. Uma melhor descrição pode ser encontrada no link. Eu joguei um pouco com alguns resultados muito interessantes, mas, como em todas as estratégias de negociação algorítmicas, eu recomendo testes sólidos de volta antes de levá-lo ao mercado ao vivo. Respondeu 10 de dezembro 12 às 11:59 Desculpe, mas apesar de ser usado como um exemplo popular na aprendizagem de máquinas, ninguém conseguiu uma previsão do mercado de ações. Não funciona por várias razões (verifique aleatoriamente a caminhada por Fama e um pouco de outros, falha de decisão racional, hipóteses erradas.), Mas o mais convincente é que se isso funcionasse, alguém poderia se tornar insanamente rico Em meses, basicamente, possui todo o mundo. Como isso não está acontecendo (e você pode ter certeza de que todo o banco tentou), temos boas provas de que isso simplesmente não funciona. Além disso: como você acha que vai conseguir o que dezenas de milhares de profissionais não conseguiram, usando os mesmos métodos que eles têm, além de recursos limitados e apenas as versões básicas de seus métodos respondidas 4 de junho 15 às 7:47 Apenas um lado em relação ao seu Razão mais compelível: as estratégias têm limites de capacidade, ou seja, níveis além do qual o impacto do mercado excederia o alfa disponível, mesmo supondo que você tivesse um capital ilimitado. Eu não tenho certeza do que você quer dizer com uma predição de mercado de quotes (ETF39s de futuros de índice), mas certamente há muitas pessoas fazendo previsões de curto prazo e se beneficiando delas todos os dias nos mercados. Ndash afekz 23 de novembro 15 às 13:19 Eu ecoo muito do que Shane escreveu. Além de ler ESL, gostaria de sugerir um estudo ainda mais fundamental das estatísticas. Além disso, os problemas que delineei em outra questão sobre esta troca são altamente relevantes. Em particular, o problema do viés de datamining é um sério obstáculo para qualquer estratégia baseada em aprendizagem em máquina.

No comments:

Post a Comment