supinfo
Ouverture de  SUPINFO USA à San Francisco en 2008. Des études en informatique en Californie à un tarif abordable ! Inscrivez-vous dès maintenant !
supinfo
Connexion :

Recherche

  
   Tout| Actus| Télécharger| Comparateur de prix| Dossiers| Forums| Jeux| Google

60 messages
ok
Je pense que l'étude ne vaut pas grand chose pour le téléchargement illégal
La plupart des gens que je connais au contraire augmentent leur téléchargement, et sur plusieurs réseaux
 
 
rollingcube a écrit:
comme disait coluche: il faut bien que les sondages changent chaque jour pour que le s journaux aient quelque chose à dire.

pour revenir aux stats, c'est marqué dans ton doc:
"Si nous étudions un univers de 5.000 personnes et que nous souhaitons obtenir un résultat de 3% d'erreur au-dessus et en dessous de la valeur (soit une fourchette de 6%), nous devons étudier un échantillon de 878 personnes."

ça veut donc dire (si j'ai bien compris) prendre 878 personnes pour étudier 5000 personnes. en gros, 17% de la population.
on est combien en IDF? 10 millions? aller, on va dire 10 millions au pire
ça veut dire 588.000 personnes à la louche pour 17%. ça fait des familles nombreuses...

soit j'ai mal compris, soit c'est complétement erroné de prendre 1500 familles (ou alors avec une marge d'erreur de 30%  :lol: )

je veux bien que les stats soient fiables, mais bon... les chiffres on peut aussi faire dire n'importe quoi... Ca doit bien en arranger, d'ailleurs :D

je veux bien qu'on m'explique si mon raisonnement est faux :)


En fait, tout dépend de la taille de "l'univers". L'accroissement de ton échantillon n'est pas linéaire par rapport à la taille de ton univers.

Ainsi, pour un univers de 10.000.000, il faut 1067 personnes pour une marge de 6% (la première ligne du tableau du lien) :jap:
 
 
pour le téléchargement illégal et la peur du gendarme et les mesures prises, les médias arrangent ca comme ca les arrange et selon ce qui leur ferait plaisir. Ils croient qu'en disant ca les irréductibles arrêteront mais c'est pas parce qu'ils prennent des mesures que ca marche forcément. D'ailleurs c'est n'importe quoi parceque les téléchargements légaux n'augmentent pas .

Mais les gens sont naïfs aujourd'hui et vont les croire bêtement !

cela dit l'étude donne des informations intéressantes !

pour les utilisateurs wifi, il faudrait savoir si c'est du wifi à la maison (livebox, freebox, ...) ou du wifi public (hotspot, ...)
 
 
BigBoy a écrit:
En fait, tout dépend de la taille de "l'univers". L'accroissement de ton échantillon n'est pas linéaire par rapport à la taille de ton univers.

Ainsi, pour un univers de 10.000.000, il faut 1067 personnes pour une marge de 6% (la première ligne du tableau du lien)  :jap:

n'empêche que les stats me paraissent quand même facilement manipulables (en général).
enfin bref, c'est pas l'intérêt de ce sujet
 
 
rollingcube a écrit:
1) n'empêche que les stats me paraissent quand même facilement manipulables (en général).
2) enfin bref, c'est pas l'intérêt de ce sujet


1) Plutot d'accord, je n'ai jamais dit le contraire. La théorie c'est beau, mais après, lors d'une publication, cela reste des chiffres...
2) tout à fait d'accord. Mon premier post répondait simplement à une remarque me semble-t-il un peu rapide...
:jap:
 
 
rollingcube a écrit:
pour revenir aux stats, c'est marqué dans ton doc:
"Si nous étudions un univers de 5.000 personnes et que nous souhaitons obtenir un résultat de 3% d'erreur au-dessus et en dessous de la valeur (soit une fourchette de 6%), nous devons étudier un échantillon de 878 personnes."

ça veut donc dire (si j'ai bien compris) prendre 878 personnes pour étudier 5000 personnes. en gros, 17% de la population.
on est combien en IDF? 10 millions? aller, on va dire 10 millions au pire
ça veut dire 588.000 personnes à la louche pour 17%. ça fait des familles nombreuses...

soit j'ai mal compris, soit c'est complétement erroné de prendre 1500 familles (ou alors avec une marge d'erreur de 30%  :lol: )


En général, les statisticiens prennent un échantillon de taille à peine suffisante pour être representatif, mais ils le prennent représentatif quand même...

Comme tu peux le constater dans le tableau du document fourni, la progression n'est pas linéaire. La progression de la taille de l'échantillon est donnée par la formule au dessus du tableau, et on est loin d'une formule du genre n=ax+b :paf:

Je me suis amusé à faire le calcul pour 64 millions (parait qu'on est environ 64 millions en france aujourd'hui), avec une marge d'erreur à 5% (la marge d'erreur traditionnelle, celle qui est utilisée dans les representation gaussiennes, et qui fait qu'un grand maigre ou un petit gros galère pour s'acheter des fringues parce qu'il rentre dans les 5% "d'erreur" :pt1cable: ) et ça donne un échantillon de 1536 personnes (j'arrondi à l'entier le plus proche, on va pas couper les gens en deux ^^').

Evidemment, la taille de l'échantillon change selon la précision désirée, et selon la taille estimée de la population. J'ai compté 64 millions, les gars qui ont fait l'étude ont peut-etre comptés 60 millions, ou pris une précision de 8%, etc...

La "précision à 95%" signifie que si on effectuait la même étude sur la population complete, on aurait des résultats semblables à au moins 95%. Donc plus ou moins 5% de variation autour du nombre de fichiers téléchargés, etc. Evidemment, pour que l'étude soit fiable, il faut que l'échantillon soit représentatif de la population. C'est pour ça qu'on fixe une taille à cet échantillon.

Si je veux savoir pour qui vont voter les gens, je vais pas aller intrerroger un échantillon de 1536 personnes dans un meeting de l'UMP, sinon je vais avoir des chiffres biaisés. Donc, outre la taille de l'échantillon, son homogénéité (ou dans un cas comme ça, sa diversité) est importante. le probleme, c'est que ça, c'est pas vraiment vérifiable sans faire l'étude sur la population. Pour limiter les risques, on prend des individus dispersés, au hasard, etc... Et on en prend une quantité suffisante pour que les diversités d'opinion ou de comportement se retrouvent "diluées" dans la masse. L'échantillon se comporte alors comme une population a échelle réduite, avec la marge d'erreur choisie.

Bien sur, il y a toujours le risque que l'échantillonnage lui-même soit foireux, et qu'on ait accidentellement interrogé une grande proportions de sympathisants PS ou UMP, et pas tellement de FN, ce qui peut entrainer des surprises à l'annonce des résultats. Même si, dans ce cas, je pense plutot que l'erreur est d'origine sociale plus que statistique : "oh c'est bon les sondages ont mis Jospin / Chirac, comme d'hab, je vais pas me faire chier à aller voter, je vais aller à la pêche"...
 
 
les probas appliquées aux humain....

franchement c vraiment nimporte quoi, il est completement débile de dire que une méthode proba marche comme s'il sagissait d'un paquet d'electrons
.Alors OUi les probas sont un outils trés puissant , OUi effectivement les indices de conf à 95 % sont valables pour 1000 realisations.
Mais que l on arrete de dire que les indices d'opinion sous des probas rigoureuses:

1- un humain ca a tendance à mentir (surtout pour des questions comme ca)
2- un pool representatif d'humain est trés complexe à definir rigoureusement (beaucoup de degrés de libertés donc l'echantillon doit etre trés gros)
3-Voyant que les resultats sont trés aleatoires les institut de sondages appliquent des recettes dignes de maïté et la cuisine des mouquetaires, je rejoute un poil par ci , je modifie l ecart-type par la et hop c prét!.
(ben oui faire un pool de 100 000 individus c pas rentable donc on bricole)
A partir de là ce n'est plus des maths cela ce rapproche plus du spiritisme.

Pour les etudes sociologiques utilisant les stats, les plus rigoureux c les gars de l'insee qui effectivement se trompent peu, mais vous remarquerez qu'il sagit JAMAIS d'enquete d'opinion , c toujours une etude de comportement verifié independamment du sujet lui meme.
 
 
chris_waddle a écrit:
Allez, va prendre des cours de proba ca évitera ce genre de remarque


aller! va revoir tes cours de proba :
l'effectif de l'échantillon doit être représentatif de toutes les classes de la populations. Où sont les descriptions de classes ici ? quelle est la méthode d'échantillonage ? où sont les estimateurs de variances ? les IC ? l'étude peut elle parler de la pop française ? doit elle être plus restrictive ? Est ce que 1000 indiv sont suffisants pour décrire une populations de 60 millions, même mathématiquement ?

Si je t'avais dans mes cours de proba, je te chaufferai grave les oreilles !
 
 
lol tiens d'un coup on les entends plus les pseudos statisticiens
 
 
+1 les stats, on leur fait dire ce que l'on veut

En même temps, que le téléchargement illégal soit en baisse, pourquoi pas !?

Au vu de la dégradation de niveau (culturel) de la musique, des films et jeux vidéos...

Et puis la peur du vilain gendarme tout pas beau qui débarque avec le GIGN à 6h du matin pour coffrer un vilain terroriste pirate p2piste tout pas beau lui non plus :pt1cable:

Bref une "étude" de + réalisée à l'aide d'une boule de cristal :paf:

C'est quoi ton métier ? Heu ben jsuis voyante chez GfK :ane:
 
 
uriel99 a écrit:
En général, les statisticiens prennent un échantillon de taille à peine suffisante pour être representatif, mais ils le prennent représentatif quand même...

effectivement : +1 une restriction

uriel99 a écrit:
Comme tu peux le constater dans le tableau du document fourni, la progression n'est pas linéaire. La progression de la taille de l'échantillon est donnée par la formule au dessus du tableau, et on est loin d'une formule du genre n=ax+b  :paf:
+1 ... lol trop fiable déjà l'étude :whistle:

uriel99 a écrit:
Je me suis amusé à faire le calcul pour 64 millions (parait qu'on est environ 64 millions en france aujourd'hui), avec une marge d'erreur à 5% (la marge d'erreur traditionnelle, celle qui est utilisée dans les representation gaussiennes, et qui fait qu'un grand maigre ou un petit gros galère pour s'acheter des fringues parce qu'il rentre dans les 5% "d'erreur"  :pt1cable: ) et ça donne un échantillon de 1536 personnes (j'arrondi à l'entier le plus proche, on va pas couper les gens en deux ^^').

aie aie aie Gaussienne ! :pt1cable: lol toi tu n'as jamais travaillé sur du vivant (ou alors dans les années 00-05... de 1900 :p ) Si les biologistes et les sociologues faisaient de la gausienne parce qu'en gros, ça fit la gaussienne, MDR la vie serait belle : les vacins fonctionneraient comme les prévisions des élections 2002, Laïka n'aurait jamais quitté la Terre, tu mangerais des fruits et des cérales toutes petites et couteuses à produire, tu risquerais l'intoxication à chaque fois que tu mangerais un yahourt,...


tu bosses pour des boites de sondage ? .... :whistle: ah ok je comprends mieux alors pourquoi ce pays dirigé par des audits va si mal :p
 
 
groland avait traité de façon humoristique mais pas si éloignée de la réalité que ca, le thème du piratage !

http://www.youtube.com/watch?v=u1IV7HzuoaA
 
 
Tu pourrais développer (en mp si tu veux) le rapport entre Laika et les representations gaussiennes? pour ma culture perso en physique (mon domaine )
 
 
<troll mod on>
hum...
normal quand la machine à musique propose que de la m***e :lol:
Cette propre m***e destinée a la branche des personnes les plus débiles :ane:

<\troll mod off>
 
 
Ces réponses mettent en évidence une baisse des fichiers téléchargés (620 millions au cours de l'année passée soit deux fois moins qu'en 2005), et cela alors même que les internautes sont plus nombreux à le pratiquer (5 millions en 2006 contre 4,4 millions en 2005).
Bah ouais ... avant tu prenais que les 2 principaux titres par album ... maintenant tu prends l'album en .zip / .rar !
Ca fait donc 2 fois moins de fichiers telechargés ... sont forts les statistiques !

Bon OK je sors -->[- ]
 
 
Je rejoint l'avis de Geppeto. J'ai travaillé en laboratoire sur l'estimation dynamique de processus markoviens et les méthodes de Monte Carlo. Le modèle gaussien est couramment utilisé car il permet en général d'obtenir des simplifications dans les calculs. De plus, lorsque que l'on a aucune information sur les densités de probabilité, c'est encore le choix qui semble le plus naturel (voir le théorème central limite).

Ceci-dit, il est dans beaucoup de cas une approximation trop éloignée de la réalité. Et je trouverais étonnant que dans un contexte aussi complexe que celui présenté, on puisse parler effectivement de pourcentages d'erreurs et faire des calculs de dimensions d'échantillons (sans parler, comme il a été suggéré, des échantillons menteurs et donc du biais engendré, sans doute loin d'être négligeable).

Enfin, ceci n'est qu'un avis personnel. Peut-être qu'un statisticien éclairé pourra me démentir.
 
 
ojploz a écrit:
1053 foyers représentatifs de la population francaise ? en ille de france ? mouhahahaha.

mouahahahah !!! +1 :clap:

Goranak a écrit:
vi vi les sondages sont fiables. Cf élection 2002.
Proba, arts divinatoires, même salade.

mouahahahah +2 :clap:
 
 
chris_waddle a écrit:
Allez, va prendre des cours de proba ca évitera ce genre de remarque

:heink:

je préfere la logique à la proba... :jap:
 
 
Noble Prince a écrit:
:heink:

je préfere la logique à la proba...  :jap:


La proba est logique, démontrable…et un échantillon de 100 personnes peut être représentatif s'il est bien fait.
 
 
Ces sondages sont donnés à titre indicatif, c'est tellement évident que ça ne peut être fiable à 100%...
Est ce que ça les rend inutile ? Est ce que la Meteo ou Bison Futé sont-ils aussi à classer dans le sac des arts divinatoires dans ta vision en noir et blanc ?
 
 
 
60 messages
ok
 
Vous devez être connecté pour écrire un message !
 

 Sujets Similaires:


 
Clubic.com
 
Achetez-facile.com
 
Jeuxvideo.fr
 
neteco.com
 
mobinaute.com