Variante 1: Du erstellst zwei identische Bilder. Eines mit der Sprechblase und eines ohne. Solche hast Du ja wahrscheinlich schon gem. deinen Bildern. Bild 1 (ohne Sprechblase) auf die TimeLine ziehen. Bild 2 hinter Bild 1 setzen und dann ins Bild 1 schieben. So ergibt sich eine sanfte Überblendung/Einblendung der Sprechblase. Je weiter Du die beiden Bilder überlagerst desto langsamer wird die Sprechblase eingeblendet.
Variante 2: Du ziehst Bild 1 in Spur 1. Bild 2 Versetzt darunter in Spur zwei. Nun ziehst Du wie @BilderMacher beschrieben hat den Anfasser und machst ein Fade In. Dann wird die Sprechblase ebenfalls sanft eingeblendet. Je grösser die Versetzung der beiden Bilder in den Spuren ist desto langsemer die Einblendung