Hermano ya lo resolvi.Resulta que tenias razon que era la rutina de 8 bits pero aparte de eso se debe usar el puerto A para las señales de control.
Por ejemplo: yo use todo el puerto B para los 8 datos y A1 para RS y A2 para E y arranco de primera.
No probe con 4 bits pero voy a ver si respetando esta topologia tambien funciona.
Un abrazo a todos los que me dieron una mano incluyendo a RADIOTECNIC que tambien se tomo su tiempo para ayudarme!!!
Saludos!!