Des de fa molt de temps ha sigut necessari en molts àmbits transmetre un cert missatge que únicament entenguen l’emissor i el receptor. Però la qüestió és, només serà capaç d’entendre el missatge el receptor? o potser algú més que escolte el missatge podrà reconstruir la informació originària?
Al llarg del temps els sistemes per a codificar s’han fet més complexos, potser fins el punt en què és pràcticament impossible descobrir el missatge originari si no es disposa d’informació addicional sobre el tipus de codificació o potser sobre el tema del missatge.
Un cas històric de gran rellevància referent a la codificació és la màquina ENIGMA, utilitzada durant la segona guerra mundial. Els missatges que es transmetien utilitzant-la no es podien descobrir si no es disposava de la clau de codificació. Una pel·lícula molt interessant referent a la persona que probablement va canviar la història s’anomena “The Imitation Game”, on es presenta la vida d’Alan Turing, una de les ments més brillants de la història.
De tota manera existeixen maneres més senzilles de codificar. A continuació us presente una manera senzilla de codificar on cada lletra es substitueix per una altra. La qüestió en aquest cas és que si sabem de manera orientativa quines són les lletres que en general més es repeteixen o el percentatge d’aparició orientatiu de cada lletra, probablement podrem recuperar els missatges originals.
A veure qui és capaç de descobrir les tres cites següents (acaben amb el nom de l’autor) on s’ha utilitzat per a les tres els mateixos canvis de lletres (per cert, les cites estan en castellà):
Az jaihake na zr anliriwec aj acjadrh r zr tacka na krz brcahr gla ce ja nac ilackr na gla ajkrc rfhacnwacne vrjkr gla aj nabrjwrne krhna. Vrhezn Altaca Antahkec
Jwabfha gla acjadaj acjadr r zr maq r nlnrh na ze gla acjadaj. Xeja Ehkatr p Trjjak
Ilrcne zrj zapaj na zr brkabrkwir ja haswahac r zr harzwnrn ce jec iwahkrj p ilrcne jec iwahkrj ce ja haswahac r zr harzwnrn. Rzuahk Awcjkawc
Com a orientació us diré que en castellà, el percentatge típic d’aparició de cada lletra és en general el següent:
e- 16,78% r – 4,94% y – 1,54% j – 0,30%
a – 11,96% u – 4,80% q – 1,53% ñ – 0,29%
o – 8,69% i – 4,15% b – 0,92% z – 0,15%
l – 8,37% t – 3,31% h – 0,89% x – 0,06%
s – 7,88% c – 2,92% g – 0,73% k – 0,00%
n – 7,01% p – 2,776% f – 0,52% w – 0,00%
d – 6,87% m – 2,12% v – 0,39%
De tota manera aquestos percentatges no serveixen estrictament per a les oracions anteriors, però sí que són relativament orientatius. A aquesta manera d’intentar descodificar missatges s’anomena Anàlisi de freqüències.