Exodus

Mióta a blogponthu-ról való elköltözés közéleti alapfeladat lett, engem is érnek megkeresések, hogy segítsek.

Az egyik ilyen felkérés egy politikus barátomtól érkezett, aki tíz éve szorgalmasan blogol, heti több bejegyzéssel, sok képpel. Nehezítésként – bár tudjuk, hogy a politikai szelek mindig határozottan ugyanarról fújnak, ellenben a föld, mint referenciapont, folyamatosan forog alattuk –, a blog neve is többször változott már.

Első ránézésre a feladat nem tűnik annyira gáznak. A blogponthu ugye generál egy xml file-t, amit a megfelelő wordpress plug-in csámcsogva megzabál, így akár kevesebb, mint félóra alatt a saját tárhelyeden fel is állhat a blogod tartalmilag. Legyél azonban óvatos, mert a tüzes istennyila abban a pillanatban, amint megszünteted a blogponthu-n az előzményeket, és konstatálod, hogy az összes képed az enyészeté lett, szilánkosra hasítja szét ezt az idillt.

A képek ugyanis a blogponthu szerverén maradnak, az xml csak belinkeli őket. A blogponthu természetesen semmilyen eszközt nem ad, hogy lementsd a képeidet, ellenben legalább nyolc különböző helyen tárolja, különféle elbaszott struktúrákban. Így aztán az tűnik logikusnak, hogy először az XML-ből nyerd ki valahogy az url listát a képekről, az alapján szedd le őket mondjuk wget-tel, rakd fel az új helyre, az adatbázisban pedig cseréld ki az URL-ek elejét.

Egy 12 Gb-os XML szövefile-ban az ember nyilván nem áll neki puszta kézzel matatni, inkább behívja valami intelligensebb szövegszerkesztőbe, mondjuk SublimeText-be, és nekiáll rákeresni a kép URL-ekre, de mivel ezeknek már a tövük sem azonos és a hosszúságuk is különböző, hamar a RegExp oldalon találod magad egy új programnyelv tanulása közben.

Végül sikerült a durván 2600 tételes listát összeraknom, kis szerencsével kevesebb, mint félóra alatt (merthogy ügyesen megtaláltam a vonatkozó RegExp scriptet), és installáltam volna a wget-et, csakhogy ez egy másfélórás hibaüzenet-kódfejtésbe torkollott (már a stackoverflow sem a régi, megjelentek rajta a dezinformátorok), ami végül a gépemen lévő őskövület HomeBrew újrarakásával oldódott csak meg.

Félórás wget manuál olvasás után végre meglettek a képek is, átraktam őket az új helyre, már csak a hivatkozásokat kell módosítani. WordPressben az adatbázist elég veszélyes kézzel megtúrni, mert mindenféle checksum mezők vannak benne, ezért a „better search replace” pluginnal szoptam egy újabb hosszú órát, mire rájöttem, hogy azért nem működik, mert az url-ből pont a protokollt nem fogadja el. De megoldottam. Úgyhogy most már csak annak a kb 600 képnek az url-jét kellene valahogy kicserélni, amiket 2010 és 2013 között valamiért év/hónap/nap folderstruktúrában tárolt a blogponthu.

Lényeg, hogy kishíján kész lett a dolog, úgyhogy tegnap volt egy olyan félórám, amikor azt éreztem, hogy nem fog rajtam a golyó, és még a faszom is nagy.

Köszönöm az üzenetet, rövidesen válaszolok rá.