CASI009 - Ciência de Dados 2

Publicado 1/23/2018, 3:55:32 PM, última modificação 9/13/2023, 4:15:59 PM

Carga horária: 45 horas-aula (3 créditos)

Ementa: Técnicas de Recuperação de Informação, Processamento de Linguagem Natural, Classificação de documentos, Análise de Sentimentos, Modelos de Linguagem, Análise de Semântica Latente, Link Analysis e Redes Complexas, Big Data, Sistemas de recomendação, Tópicos especiais.

Bibliografia:

  • BAEZA-YATES, R.; RIBEIRO-NETO, Berthier. Modern information retrieval: the concepts and technology behind search. 2nd ed. Harlow: Addison-Wesley, 2011. xx, 913 p. ISBN 9780321416919.

  • MANNING, Christopher D.; RAGHAVAN, Prabhakar; SCHUTZE, Hinrich. Introduction to information retrieval. New York: Cambridge University Press, 2008. xxi, 482 p. ISBN 9780521865715.
  • MITCHELL, T. Machine Learning. McGraw Hill, 1997.
  • MANNING, Christopher D.; SCHUTZE, Hinrich. Foundations of statistical natural language processing. Cambridge, Massachusetts: The MIT Press, 1999. 680 p. ISBN 9780262133609.
  • Newman, Mark. Networks: an introduction. OUP Oxford, 2010. 720p. ISBN 0199206651.
  • BLUM, A.; HOPCROFT, J.; KANNAN, R. Foundations of Data Science. Cambridge University Press, 2020.
  • GOLDBERG, Y. Neural Network Methods for Natural Language Processing. Springer International Publishing, 2017.
  • GOODFELLOW, I.; BENGIO, Y.; COURVILLE, A.. Deep Learning. MIT Press, 2016.
  • TUNSTALL, L.; WERRA, L. von; WOLF, T. Natural Language Processing with Transformers. 2022 O'Reilly Media, Inc.