Capturando conteúdo HTML com JSoup

Este post foi removido e transferido para a seguinte url:

http://www.mballem.com/post/capturando-contedo-html-com-jsoup

Anúncios

, , , ,

  1. #1 por Thiago L. Silva em 25/05/2012 - 13:51

    O tutorial esta muito bom. Parabéns. Me ajudou bastante.

  2. #2 por MBallem em 25/05/2012 - 14:32

    Boa tarde Thiago, valeu pelo comentário. Legal que tenha sido útil.
    Abr!

  3. #3 por alexandre em 10/08/2012 - 17:59

    Boa tarde beleza… uma pergunta com o jsoup é possível manipular css se não conhece alguma api java para isso grato e muito bom tutorial.

  4. #4 por MBallem em 10/08/2012 - 19:46

    Olá Alexandre. Eu na verdade não tentei manipular um CSS, mas segundo a documentação é possível sim.
    Da uma olhada aqui: http://jsoup.org/cookbook/extracting-data/selector-syntax

  5. #5 por Namor em 24/08/2012 - 20:59

    Gostei muito do tutorial, parabéns.

  6. #6 por MBallem em 25/08/2012 - 18:07

    Valeu Namor, legal saber que foi útil para você.

  7. #7 por lima em 15/10/2012 - 18:55

    Se eu quisesse armazenar o conteudo do texto desse artigo por exemplo, eu faria isso usando a classe Document tambem ou usaria um stringBuffer?

  8. #8 por MBallem em 15/10/2012 - 20:10

    Olá Lima.
    A classe Document vai na verdade receber todo o conteúdo do html que você estiver lendo. Para capturar o texto do artigo, você precisa analisar o html e ver em qual tag ele se encontra.

  9. #9 por lima em 29/10/2012 - 12:07

    entendi, nesse caso qual seria a melhor maneira de armazenar o texto para utiliza-lo posteriormente? tem alguma classe no Jsoup que faz isto ou devo utilizar o metodos do Java msmo?

  10. #10 por MBallem em 29/10/2012 - 12:17

    Depois de capturar o texto, acho que seria armazenar em um String mesmo, ou um StringBuffer.

  11. #11 por Lima em 01/11/2012 - 13:32

    Olá MBallem, estou com um probleminha, eu fiz um FOR com um element até o tamanho da lista elements e quero compara se a posição anterior a posição atual possui determinado texto, caso tenha eu capturo o texto da posição atual, deu pra entender? porém eu não consegui descobrir qual o método eu faria isso. da uma olhada no codigo:
    for (Element p : children){
    if (children (p-1) == Resumo)
    String textResume = p.getElementsByTag(“font”).text();
    System.out.println( ” “+ textResume );

  12. #12 por MBallem em 01/11/2012 - 14:55

    Oi Lima, método para isso você não vai encontrar mesmo. Talvez você consiga isso usando um for comum:
    for(i=0; i < children.size(); i++) {
    children.get(i-1).getElementsByTag("").text() == resumo
    }

    assim você talvez possa comparar a posição anterior da lista com a posição atual.

  13. #13 por Soares em 19/02/2013 - 23:51

    Como faço para alternar entre paginas em um site onde eu faço uma busca e ele me retorna um resultado dividido em paginas. o Site utiliza javascript para fazer a mudança das páginas.

  14. #14 por MBallem em 20/02/2013 - 9:57

    Olá Soares! Se a URL não muda quando você troca a página, dai acho que não é possível capturar o conteúdo das páginas seguintes.

  15. #15 por Danilo em 03/07/2013 - 21:41

    Olá, primeiro, excelente blog!

    Agora uma pergunta, estou com dúvidas de como usar o jsoup com sistema de login, a pagina é em aspx e tem um login por método POST de início.

    Eu pesquisei no google por respostas, mas todas que encontrei não consegui entender o funcionamento e não consegui fazer funcionar na minha pagina de login

  16. #16 por MBallem em 04/07/2013 - 12:10

    Olá Danilo! Não entendi o que você deseja. Como assim usar o JSoup como sistema de login?

%d blogueiros gostam disto: