Résumé. Le corpus issu d'Internet fait émerger de nouvelles problématiques pour les sciences de l'information et de la communication ainsi que pour l'analyse du discours. Au moment de traiter des données multiformes nous risquons de les adapter aux outils déjà existants en contournant les aspects qu'il n'est pas possible de saisir tels que la volatilité des contenus et la multiplicité des signes. Sur une seule page web nous pouvons être confrontés à des photographies, des vidéos, des hyperliens, etc. qui sont constamment actualisés en fonction des contenus. Dans le cadre de cet article nous nous proposons de formuler des réflexions autour de la notion de corpus compris comme une construction de données complexes due à une hétérogénéité de deux types : énonciative et technique. Cet aspect est traité en rapport avec une première analyse de corpus de six sites web de salles de théâtre provenant du Chili, de France et d'Espagne. Une telle démarche nous a permis de dégager les premières conclusions autour des données provenant d'Internet : la diffusion des contenus émanant des sites web et répandus également sur les réseaux sociaux provoque l'amplification du rôle du destinataire, qui devient producteur des contenus ainsi que diffuseur et critique de spectacles de théâtre à l'affiche.Abstract. The corpus derived from the Internet causes new difficulties for information and communication sciences, as well as for discourse analysis. When analyzing multiform data there is a risk of adapting them to the already existing tools, therefore bypassing aspects that were not possible to take into account as content volatility and sign multiplicity. For example, in a web page we can be confronted by pictures, videos, and hyperlinks that are constantly being actualized according to the content. This paper formulates ideas on the concept of corpus, understood as the construction of complex datadue to two types of heterogeneity: enuciative and technical. Drawing on a preliminary analysis of six websites belonging to theater halls from Chile, France and Spain, the corpus will be fully addressed and discussed. Initial findings regarding data sets from the Internet, reveal how the diffusion of content from websites and its spread to the social networks reates an amplification of the role of receivers who become both content diffusers and theater show critics.