För nästan 5000 år sedan skapade ett hemlighetsfullt folk ett otal sigill, tabletter och amuletter (man har räknat in sammanlagt runt 5000 stycken) i indusdalen med en mystisk text som fram till helt nyligen varit helt omöjlig att tyda, förutom några få symboler. Ett nytt datorprogram är tänkt att råda bot på det. Programmet utvecklades ursprungligen för att avkoda DNA-strängar och bygger på att en statistisk modell sätts upp utifrån alla sekvenser av symboler som man funnit (symbolerna bildar associerande mönster på en jättelik symbolkarta). De få symboler som man tidigare lyckats tyda utgör basen. Basen fylls sedan på med hjälp av en form av statistisk syntes där man i första hand letar efter signifikanta symboler; dvs. symboler som utgör nycklar till förståelsen av texten i sin helhet. Syntesen är självförstärkande, dvs. för varje ny symbol som lösts, ökar den statistiska sannolikheten för att de nya symboler man undersöker i sin tur får sin lösning.
Ett viktigt skäl till att texten inte kunnat lösas tidigare beror på att det inte finns några två- eller flerspråkiga texter där den mystiska texten ingår. Detta har tidigare varit det enda sättet att tyda okända texter på (tänk t.ex. på Rosettastenen som innehåller samma text skriven med egyptiska hieroglyfer och grekiska bokstäver).
Ledaren för projektet är den finske professorn Asko Parpolo vid Helsingfors universitet.