Alex Chalkidis
Technology, retail, kids and mountains

Facebook data mining

Ιανουαρίου 5, 2010 23:59 by alexanderchalkidis

Είναι ίσως ότι πιο ερεθιστικό σαν ιδέα για οποιονδήποτε προέρχεται από κοινωνικές επιστήμες.  Η ιδέα να είχες στην διάθεσή σου τα δεδομένα από το σύνολο των διαδράσεων στο Facebook.  Μετά το εξωφρενικό μονοπώλιο της Google στα δεδομένα αναζήτησης, αυτό είναι ίσως το δεύτερο καλύτερο.  Κυρίως επειδή είναι προσωπικές πληροφορίες, σχετικά αφιλτράριστες.  350 εκατομμύρια χρήστες, οι μισοί εκ των οποίων μπαίνουν κάθε μέρα και 35 εκατομμύρια από αυτούς ανανεώνουν την κατάστασή τους σε οποιοδήποτε 24ωρο. 

Όπως και η Google, η εταιρεία μας πετάει κάθε τόσο ένα ξεροκόμματο δεδομένων για να μας τρέχουν τα σάλια.  Μέσα στις γιορτές έκαναν την ανασκόπηση των πιο σημαντικών γεγονότων γύρω από τα status updates των χρηστών στις ΗΠΑ.  (Οι οποίοι αντιπροσωπεύουν πλέον μόλις το 30% του συνόλου χρηστών στο Facebook.)  Πρώτο βέβαια γεγονός το Farmville με πάνω από 70 εκατομμύρια ενεργούς χρήστες τον μήνα αν και ξεκίνησε μόλις τον προηγούμενο Ιούνιο.  Ο Η1Ν1 ήταν από τα πιο δημοφιλή θέματα και μάλιστα είναι ενδιαφέρον ότι στην πορεία βγήκε από την περιγραφή ο όρος "γρίππη των χοίρων".   Michael Jackson, Patrick Swayze, Billy Mays επιβεβαίωσαν τον κανόνα ότι μεταθάνατον συνήθως γίνεται η μεγαλύτερη επιτυχία για κάποιους ανθρώπους του θεάματος.   Από ταινίες New Moon, Transformers, Star Trek, The Hangover, Paranormal Activity και Harry Potter. 

Έχουν ενδιαφέρον και οι επιμέρους αναλύσεις συγκριτικές όπως για τις λέξεις που έχουν να κάνουν με την οικογένεια εδώ:

O μέσος χρήστης του Facebook περνάει 55 λεπτά την ημέρα συνδεδεμένος και έχει 130 φίλους (εκτός από την Ελλάδα όπου απλά κάνουν όλοι κόντρα και μαζεύουν κάθε λογής σαβούρα!) και είναι μέλος σε 12 ομάδες.  Ο διάσημος "μέσος χρήστης" επίσης πατάει "μου αρέσει" σε 9 νέα και σχολιάζει 25 τον μήνα. 

Για μια ενδιαφέρουσα αντίδραση στο γεγονός ότι μπαίνουν όλο και περισσότεροι γονείς στο Facebook πάντως, δείτε το http://myparentsjoinedfacebook.com/ , μια ιστοσελίδα στην οποία ανεβάζουν τα πιο γαργαλιστικά επεισόδια σχέσεων παιδιών με γονείς όπως τα επηρεάζει η συνύπαρξη στο Facebook!


Γίνετε ο πρώτος που θα βαθμολογήσει αυτή τη δημοσίευση

  • Currently 0/5 Stars.
  • 1
  • 2
  • 3
  • 4
  • 5

Tracking you without an IP is easy for Google

Δεκεμβρίου 5, 2009 09:52 by alexanderchalkidis

Με απλά λόγια πως ακριβώς ξέρει ακριβώς μια μηχανή αναζήτησης τι κάνετε.  Για τους περισσότερους χρήστες είναι πολύ απλό γιατί έχουν μια μοναδική διεύθυνση, την λεγόμενη IP.  Απλά κλειδώνουν σε αυτή για αναγνώριση.  Πολλοί τρομάζουν που το Google τους λέει και που είναι γεωγραφικά ενώ είναι βέβαια απλό αφού η σύνδεσή σας είναι σε συγκεκριμένο σημείο και με συγκεκριμένη δρομολόγηση.  Αλλά επιχειρηματικός μου αντίπαλος θα είχε πολλά να κερδίσει αν ήξερε ότι είμαι στο δασικό χωριό και συνεπώς 5 ώρες μακριά από την Αθήνα.  Εχει δικαίωμα το Google να χρησιμοποιήσει αυτή την πληροφορία;


Κάποιοι (ελάχιστοι γιατί γίνεται όλο και πιο δύσκολο να το κάνεις χωρίς να καθυστερεί η περιήγηση στο διαδίκτυο) χρησιμοποιούν διάφορα τερτίπια για να κρύψουν την IP τους.  Είναι ανούσιο αλλά απλά δεν καταλαβαίνουν πόσο έντονο είναι το "αποτύπωμα" του κάθε χρήστη.  Προφανώς εταιρείες σαν το Google που χαρίζουν δωρεάν εφαρμογές διαρκώς έχουν πολλούς άλλους τρόπους να σας "πιάσουν" είτε είναι από το Blogger, το Gmail, το GoogleMaps, Latitude, Picasa και ένα σωρό "δωρεάν" υπηρεσίες τους.  Μόλις κάνετε log in, ακόμα και αν χρησιμοποιείτε σύστημα απόκρυψης της IP το παιχνίδι έχει ουσιαστικά τελειώσει .

Είδους αποτυπωμάτων που καταγράφονται:


1. Η σειρά που επισκέπτεστε άλλες ιστοσελίδες
2. Η ταχύτητα δακτυλογράφησης
3. Άλλα προγράμματα που είναι ανοιχτά ταυτόχρονα.  (Είναι αρκετά ιδιαίτερο χαρακτηριστικό αυτό - κοιτάξτε την Διαχείριση εργασιών σας τακτικά και διαπιστώσετε ότι υπάρχουν επαναλαμβανόμενα μοτίβα)
4. Το "στήσιμο" του browser σας.  Ειδικά αν έχετε πρόσθετα.
5. Εγκατεστημένα Spyware.  Ο ορισμός του spyware είναι πολύ συγκεχυμένος και ένα σωρό πράγματα "κάθονται" για λίγο ή και μόνιμα μαζί μας καθώς σερφάρουμε.
6. Entry paths, δηλαδή ποιές ακριβώς σελίδες συνηθίζετε να επισκέπτεστε για να "μπείτε" σε έναν δικτυακό τόπο.  Εγώ πχ κάνω τις αναζητήσεις μου από το παράθυρο (εκεί πάνω δεξιά είναι!) του browser.     Όταν επισκέπτεστε ένα forum από ποια σελίδα "μπαίνετε";
7. Τρόπος αναζήτησης.  Πόσες λέξεις κλειδιά βάζετε συνήθως, πόσο γρήγορα κάνετε κλικ σε ένα από αυτά, με ποιά σειρά βάζετε τους όρους αναζήτησης.

Δεν χρειάζεται να συνεχίσω, τώρα δείτε ένα καλό επεισόδιο του CSI και καταλαβαίνετε πως σκέφτονται εκεί στο Google.  Για να κάνουν καλύτερες τις αναζητήσεις σας...ναι καλά!

Επίσημα από το Google (χάρη στην έρευνα της ΕΕ που συνεχίζεται) παραδέχονται ότι κρατάνε για δύο ως πέντε έτη στοιχεία όπως τα email (ναι, και το περιεχόμενό τους αναλύεται), λίστες αναζητήσεων (δηλαδή το καθετί που βάλατε στο Google να βρείτε) και οτιδήποτε άλλο κάνετε όσο είστε logged in σαν χρήστης τους.  Με εγκατεστημένη την Google toolbar ή το Google Gears μάλιστα αυτό είναι ουσιαστικά...πάντα και ας μην το σκέφτεστε γιατί είστε σε ιστοσελίδα άλλης εταιρείας.  

Και τι να κάνουμε;  Ναι, υπάρχουν και άλλες μηχανές αναζήτησης.  Πειραματίζομαι διαρκώς και βέβαια όλο στο Google γυρνούσα.  Τον τελευταίο καιρό όμως το www.bing.com της Microsoft με καλύπτει σε μεγάλο βαθμό, δηλαδή για ένα 70% περίπου των αναζητήσεων μου.  Είναι και καλύτερο από το Google στις εικόνες σαν interface.  Και σε πολλές αναζητήσεις είναι σαφώς καλύτερα τα αποτελέσματα του Bing.
Αν αναλύσετε προσεκτικά τα αποτελέσματα μιας αναζήτησης στο Google θα διαπιστώσετε ότι υπάρχει αρκετή σαβούρα.  Ο εγκέφαλός μας όμως δεν είναι σχεδιασμένος έτσι.  Σαν την μαϊμού που ψάχνει μπανάνες στο δέντρο, επικεντρωνόμαστε στην ανταμοιβή της μπανάνας και όχι στις σάπιες εκεί ακριβώς δίπλα.  Έτσι δουλεύει ο εγκέφαλός μας.  Και για αυτό το Google κυριαρχεί.  Είναι αρκετά καλό για να κάνουμε την δουλειά μας, χορταίνουμε από τις μπανάνες του.

Πολλοί σε αυτό το στάδιο του ειρμού θα πούνε "ΟΚ, τι να κάνουμε, δεν έχω μυστικά εγώ, ας με παρακολουθεί το Google.  Στο κάτω κάτω μου προσφέρει εκπληκτικά γρήγορα πολύ καλά αποτελέσματα.  Τι με νοιάζει κι αν είναι μονοπώλιο;"  Είναι καλύτεροι από την Microsoft δεν είναι;  Να σας κάνω έναν παραληλλισμό.  Αν η Microsoft φτιάχνει το αυτοκίνητο που οδηγάει το 90% του πλανήτη, η Google ελέγχει το 90% του τι βλέπεις από τα παράθυρα!  (Και συνεπώς που πηγαίνεις τελικά.)

Επιπλέον είναι ουσιαστικά αδύνατον να ελεγχθεί πλέον γιατί οι βάσεις δεδομένων της είναι τόσο πολύπλοκες και με ιδιώματα σαν αυτά που περιγράφω στην λίστα τρόπων παρακολούθησης τα οποία ούτε που καταλαβαίνει ο περισσότερος κόσμος, πόσο μάλλον ένας κυβερνητικός ερευνητής.  Πρόσφατα υπέγραψαν συνεργασία Yahoo και Facebook.  Αν μπορείτε να ελέγξετε τι ακριβώς ανταλλάσουν βάλτε μου σκουλαρήκι.  Προσωπικά υποθέτω ότι είναι δεδομένα χρηστών ώστε να γίνει πιο αποτελεσματική η διαφήμιση στο Facebook (γενικά αποτυχημένη ως τώρα).   Δηλαδή θα στέλνει η βάση δεδομένων του Yahoo την πληροφορία ότι αυτός ο χρήστης που κοιτάει τώρα την αρχική του σελίδα στο Facebook, έχει κάνει πολλές αναζητήσεις για ποδήλατα τελευταία (ή το έχει γράψει πολύ σε email).  Θα βλέπετε εσείς μια πιο σχετική διαφήμιση εκεί δεξιά και είναι πιο πιθανό να κάνετε κλικ.

Αν απαντήσετε "Που είναι το πρόβλημα;" σε αυτή την σκέψη, το άρθρο μου τελειώνει εδώ για εσάς.  Κλείστε το παράθυρο και γυρίστε στο Facebook... 

Συγκεντρωτικά τα άρθρα μου σε αυτό το blog που έχουν να κάνουν με το Google πατώντας στα keywords πάνω στο Google ή εδώ.  Ομοίως και για το Facebook αν και μεγαλύτερη επιτυχία είχε μια πρόσφατη περίληψη των επιχειρημάτων εδώ.


Έχει βαθμολογηθεί με 4.0 από 1 ανθρώπους

  • Currently 4/5 Stars.
  • 1
  • 2
  • 3
  • 4
  • 5