Olá!
Quando os encontros AM, EM e EN estiverem na última sílaba de uma palavra, não serão considerados dígrafos, mas ditongos decrescentes nasais. Diante disso, a palavra "tempo", por exemplo, tem dígrafo vocálico EM, mas a palavra "comem", tem ditongo decrescente nasal EM, por estar no final da palavra (última sílaba).
No caso, essa diferença de 06 letras para 05 fonemas se deu em razão do dígrafo AM que, apesar de ter duas letras, é considerado apenas como 1 único fonema. Seria algo como TÃBEI.
Abraço