DS4AA
No âmbito do objetivo nacional da Estratégia Europa 2020, Portugal pretendeu reduzir a taxa de taxa de abandono escolar a um valor abaixo dos 10%, sendo que, em 2018, esta se situava em cerca de 15%. Na Europa, a média situava-se nos 11%. Ao mesmo tempo, pretendia-se aumentar a percentagem da população com idade entre 30 e 34 anos que concluiu o ensino superior de 31% para, pelo menos, 40 % em 2020. Como a Comissão Europeia declarou recentemente, o abandono escolar é um obstáculo ao crescimento económico e ao emprego, dificultando a produtividade e a competitividade, promovendo a pobreza e a exclusão social. Este projeto pretendeu analisar os antecedentes do desempenho académico à escala nacional, usando micro dados dos alunos do ensino secundário público.
Múltiplas medidas de desempenho académico foram utilizadas: classificações finais e às disciplinas, se o aluno ficou retido ou não, assim como observações dos professores. O projeto envolve a NOVA Information Management School (NOVA IMS) e a Direção-Geral de Estatísticas da Educação e Ciência (DGEEC) do Ministério da Educação. Estas duas instituições têm um histórico de colaboração nos últimos dois anos. Este projeto visou também preencher uma lacuna que existia uma vez que as técnicas de inteligência artificial e de ciência de dados não tinham ainda sido utilizadas no contexto do desempenho académico. Assim, concentramo-nos nos fatores previamente identificados que mais afetam o desempenho académico (i.e., características dos alunos, dos pais, e das escolas), utilizando métodos de inteligência artificial supervisionados numa vasta quantidade de dados históricos fornecidos pela DGEEC, desenvolvendo um modelo preditivo que evidencia os fatores mais importantes no desempenho académico. Assim, os especialistas na área do desempenho académico poderão extrair insights úteis relacionados com fenómeno do desempenho académico.
As principais contribuições do projeto são:
- ser uma das primeiras iniciativas a utilizar métodos de ciência de dados para estudos de desempenho académico em larga escala;
- promoção do desempenho académico, proporcionando aos decisores públicos, escolas e professores uma melhor compreensão dos seus antecedentes, assim como uma previsão individual (a nível dos alunos) no desempenho académico;
- ajudar Portugal e outros estados-membros a atingir os objetivos da Estratégia Europa 2020 para o desempenho académico;
- para os investigadores, elucidar quais são os principais antecedentes do desempenho académico, utilizando métodos avançados que, no nosso melhor conhecimento, não tinham ainda sido utilizados neste contexto;
- utilizar dados que já se encontram recolhidos, mas que, no entanto, não tinham ainda sido utilizados;
- desenvolver e disponibilizar um conjunto de modelos preditivos que, no início de cada ano letivo, disponibilizem uma previsão sobre o nível de desempenho académico previsto para cada aluno;
- utilizar eficientemente métodos de ciência de dados e inteligência artificial para desenvolver análises de regressão e classificação num contexto caracterizado por uma grande quantidade de dados reais, permitindo assim um processo de tomada de decisão mais informado e eficiente.
Os resultados esperados do projeto incluem:
- um modelo conceptual para compreender o desempenho académico;
- uma análise com sugestões de melhoria das bases de dados do Ministério da Educação em Portugal;
- um enquadramento de ciência de dados e inteligência artificial que melhore a eficiência dos processos de tomada de decisão da administração pública, conduzindo assim a um melhor e mais eficaz processo de tomada de decisão.
Os membros da equipa de investigação são multidisciplinares, com especialistas na área da ciência de dados; na construção e subsequente validação empírica de modelos teóricos no contexto das tecnologias da informação; na compreensão do impacto de métodos educativos inovadores, no contexto individual e empresarial ou no papel da educação na divisão digital. Juntos, os membros da equipa têm mais de 250 artigos publicados em revistas e conferências internacionais, totalizando cerca de 25.000 citações, das quais cerca de 6.000 foram em 2021. Vale também a pena mencionar todos os membros são jovens investigadores já que concluíram os seus doutoramentos nos últimos dez anos. Este projeto também permitirá a conclusão de dois doutoramentos (Catarina Nunes e Ricardo Costa-Mendes) e duas teses de mestrado (Ana louro e Beatriz Afonso).