Az egyik ilyen felkérés egy politikus barátomtól érkezett, aki tíz éve szorgalmasan blogol, heti több bejegyzéssel, sok képpel. Nehezítésként – bár tudjuk, hogy a politikai szelek mindig határozottan ugyanarról fújnak, ellenben a föld, mint referenciapont, folyamatosan forog alattuk –, a blog neve is többször változott már.
Első ránézésre a feladat nem tűnik annyira gáznak. A blogponthu ugye generál egy xml file-t, amit a megfelelő wordpress plug-in csámcsogva megzabál, így akár kevesebb, mint félóra alatt a saját tárhelyeden fel is állhat a blogod tartalmilag. Legyél azonban óvatos, mert a tüzes istennyila abban a pillanatban, amint megszünteted a blogponthu-n az előzményeket, és konstatálod, hogy az összes képed az enyészeté lett, szilánkosra hasítja szét ezt az idillt.
A képek ugyanis a blogponthu szerverén maradnak, az xml csak belinkeli őket. A blogponthu természetesen semmilyen eszközt nem ad, hogy lementsd a képeidet, ellenben legalább nyolc különböző helyen tárolja, különféle elbaszott struktúrákban. Így aztán az tűnik logikusnak, hogy először az XML-ből nyerd ki valahogy az url listát a képekről, az alapján szedd le őket mondjuk wget-tel, rakd fel az új helyre, az adatbázisban pedig cseréld ki az URL-ek elejét.
Egy 12 Gb-os XML szövefile-ban az ember nyilván nem áll neki puszta kézzel matatni, inkább behívja valami intelligensebb szövegszerkesztőbe, mondjuk SublimeText-be, és nekiáll rákeresni a kép URL-ekre, de mivel ezeknek már a tövük sem azonos és a hosszúságuk is különböző, hamar a RegExp oldalon találod magad egy új programnyelv tanulása közben.
Végül sikerült a durván 2600 tételes listát összeraknom, kis szerencsével kevesebb, mint félóra alatt (merthogy ügyesen megtaláltam a vonatkozó RegExp scriptet), és installáltam volna a wget-et, csakhogy ez egy másfélórás hibaüzenet-kódfejtésbe torkollott (már a stackoverflow sem a régi, megjelentek rajta a dezinformátorok), ami végül a gépemen lévő őskövület HomeBrew újrarakásával oldódott csak meg.
Félórás wget manuál olvasás után végre meglettek a képek is, átraktam őket az új helyre, már csak a hivatkozásokat kell módosítani. WordPressben az adatbázist elég veszélyes kézzel megtúrni, mert mindenféle checksum mezők vannak benne, ezért a „better search replace” pluginnal szoptam egy újabb hosszú órát, mire rájöttem, hogy azért nem működik, mert az url-ből pont a protokollt nem fogadja el. De megoldottam. Úgyhogy most már csak annak a kb 600 képnek az url-jét kellene valahogy kicserélni, amiket 2010 és 2013 között valamiért év/hónap/nap folderstruktúrában tárolt a blogponthu.
Lényeg, hogy kishíján kész lett a dolog, úgyhogy tegnap volt egy olyan félórám, amikor azt éreztem, hogy nem fog rajtam a golyó, és még a faszom is nagy.