In multizellulären Organismen findet man spezialisierte Zellen, die jeweils eine bestimmte Funktion wahrnehmen. Diese zellulären Unterschiede beruhen alle auf der identischen Sequenzinformation, die im Zellkern gespeichert ist. Daher muss diese Sequenzinformation von den verschiedenen Zelltypen unterschiedlich interpretiert werden. Während des frühen Entwicklungsstadiums einer Zelle muss diese Übersetzung räumlich und zeitlich streng kontrolliert werden. Die jeweilige Interpretation der Sequenzinformation umfasst die kontrollierte Aktivierung und Stilllegung spezifischer Gene, sodass ein Protein nur in bestimmten Zellen exprimiert wird. Dafür ist eine weitere Informationsebene vonnöten, die sich von der reinen Basensequenz abhebt. Ein Aspekt dieser regulatorischen Informationsebene beruht auf funktionellen Gruppen an der C5‐Position der kanonischen Base dC. Heute kennt man vier dieser regulatorischen, nichtkanonischen Basen, die eine CH3‐, CH2OH‐, CHO‐ oder COOH‐Gruppe aufweisen. Während 5‐Methylcytidin schon lange als eine der Basen im Genom mit dieser Funktion bekannt ist, wurden die anderen drei Basen – und die für die Entstehung verantwortlichen Enzyme – erst kürzlich entdeckt.