Thesis opportunity: Image-to-text conversion using Generative AI

Teoresi è una società internazionale di servizi di ingegneria, nata a Torino nel 1987.
Siamo specializzati nel supportare le aziende nella realizzazione di progetti che utilizzano tecnologie all'avanguardia, dalla guida autonoma alle nanotecnologie applicate all’ambito medicale. Il nostro approccio innovativo prevede una stretta collaborazione con i reparti di Ricerca e Sviluppo dei principali marchi industriali. Realizziamo soluzioni chiavi in mano accelerando il time-to-market del cliente. Teoresi è una delle 10 aziende selezionate da Amazon per collaborare allo sviluppo di nuovi prodotti basati sull’interazione vocale di Alexa.

Siamo sempre alla ricerca di persone di talento da inserire nel nostro team. In Teoresi diamo valore agli aspetti innovativi di ogni sfida progettuale , al lavoro di squadra, alla diversità e e ci piace pensare liberi da confini, non solo geografici. Siamo costantemente aggiornati sui progressi tecnologici, dando priorità alle persone e alla sostenibilità ambientale. Il nostro team multidisciplinare e la nostra presenza globale ci permettono di offrire opportunità di carriera internazionali e di soddisfare le esigenze di un mercato in costante evoluzione. Crediamo che la proattività e la curiosità per l'apprendimento continuo siano essenziali in un contesto di squadra e ci impegniamo a generare innovazione in tutto ciò che facciamo.
Se condividi i nostri valori e ti interessa far parte di un'azienda orientata al futuro, continua a leggere e candidati!

Description

Research question

In the realm of artificial intelligence, bridging the semantic gap between images and text has been a longstanding challenge. This thesis project aims to explore and develop novel methodologies utilizing Generative AI techniques for efficient and accurate conversion of images to textual descriptions.

The project will be developed following this workflow:

  • State of the art
  • Dataset research and analysis
  • Development of the model (Designing novel architectures or adapting existing generative models to effectively encode visual information and generate coherent textual descriptions)
  • Fine-tuning and Optimization (Implementing fine-tuning strategies and optimization techniques to enhance the performance and generalization capabilities of the model)
  • Model validation

 

Deliverables

  • Code of prototype (e.g. GitHub repo)
  • PPT and Word reports

 

Keywords:  python ; Artificial Intelligence ;  generative AI ; Computer vision ; NLP

Company Teoresi Group -> Teoresi S.p.A. | Italy
Job requirements

Student requirements:

  • Good knowledge in Python programming
  • Familiarity with Deep Learning and Python related libraries (e.g. keras, tensorflow)
  • Skills in Image Processing and Computer Vision
  • Object-oriented programming skills
  • Good organization, presentation and communication skills (e.g. provide periodically ppt and word reports to support development work)
  • Self-organized
  • Previous experience with generative AI (nice to have)
  Thesis type: Remote/ In site   Contacts: vincenza.tufano@teoresigroup.com, annalisa.letizia@teoresigroup.com

Education

Laureando

Career level

Student

.