www.transicionestructural.NET es un nuevo foro, que a partir del 25/06/2012 se ha separado de su homónimo .COM. No se compartirán nuevos mensajes o usuarios a partir de dicho día.
0 Usuarios y 1 Visitante están viendo este tema.
Para relajarnos un poco y porque soy bastante friki, les traigo esto sobre las limitaciones de las IA's para contextualizar personajes de anime dentro de la vida real:CitarKaguya-sama: Las IA no pueden dibujar a Chika comiendo ramenhttps://somoskudasai.com/noticias/cultura-otaku/kaguya-sama-las-ia-no-pueden-dibujar-a-chika-comiendo-ramen/ En todo caso, eso ocurre porque a esas IA's tienen un entrenamiento trolleado. Imaginemos, por un imaginar, las ilimitadas posibilidades que tiene eso en ciertas manos.En cuanto a ése anime, es divertidísimo, y a la chica que traigo la han traído porque es carne de todo tipo de memes.
Kaguya-sama: Las IA no pueden dibujar a Chika comiendo ramenhttps://somoskudasai.com/noticias/cultura-otaku/kaguya-sama-las-ia-no-pueden-dibujar-a-chika-comiendo-ramen/
Cita de: wanderer en Noviembre 02, 2022, 13:38:10 pmPara relajarnos un poco y porque soy bastante friki, les traigo esto sobre las limitaciones de las IA's para contextualizar personajes de anime dentro de la vida real:CitarKaguya-sama: Las IA no pueden dibujar a Chika comiendo ramenhttps://somoskudasai.com/noticias/cultura-otaku/kaguya-sama-las-ia-no-pueden-dibujar-a-chika-comiendo-ramen/ En todo caso, eso ocurre porque a esas IA's tienen un entrenamiento trolleado. Imaginemos, por un imaginar, las ilimitadas posibilidades que tiene eso en ciertas manos.En cuanto a ése anime, es divertidísimo, y a la chica que traigo la han traído porque es carne de todo tipo de memes.Veo tu imagen... y subo a un oneshot (disculpen, no he podido aguantarlo ):https://old.reddit.com/r/manga/comments/yjp9tj/disc_my_girlfriend_is_aidrawn_a_oneshot_by_h071019/
La solución de los investigadores estadounidenses no necesita agua, ya que los elementos radiactivos se almacenan en sal fundida en lugar de en barras de combustible. La sal, dice el equipo, tiene una temperatura de fusión extremadamente alta (550 grados celsius) y al entrar en contacto con los residuos radioactivos hace que la temperatura de estos descienda rápidamente por debajo del punto de fusión. Cuando la sal se cristaliza absorbe el calor, evitando el peligro de una fusión del núcleo.
https://elpais.com/ciencia/2022-11-05/valter-longo-el-ayuno-nos-puede-ayudar-a-vivir-20-anos-mas.htmlSaludos.
Scientists Manufacture Material in a Lab That Doesn't Exist on EarthPosted by EditorDavid on Monday November 14, 2022 @07:34AM from the out-of-this-world dept.NPR reports that "two teams of scientists — one at Northeastern University in Boston; the other at the University of Cambridge in the UK — recently announced that they managed to manufacture, in a lab, a material that does not exist naturally on Earth.""It — until now — has only been found in meteorites."CitarWe spoke to Laura Henderson Lewis, one of the professors on the Northeastern team, and she told us the material found in the meteorites is a combination of two base metals, nickel and iron, which were cooled over millions of years as meteoroids and asteroids tumbled through space. That process created a unique compound with a particular set of characteristics that make it ideal for use in the high-end permanent magnets that are an essential component of a vast range of advanced machines, from electric vehicles to space shuttle turbines.The compound is called tetrataenite, and the fact that scientists have found a way to make it in a lab is a huge deal. If synthetic tetrataenite works in industrial applications, it could make green energy technologies significantly cheaper. It could also roil the market in rare earths, currently dominated by China, and create a seismic shift in the industrial balance between China and the West....But it will be a long time before tetrataenite is in a position to disrupt any existing markets, Laura Lewis says. She says there is still a lot of testing to be done to find out whether lab tetrataenite is as hardy and as useful as the outer space material. And even if it turns out to be as good, it will be five to eight years "pedal to the metal" before anyone could make permanent magnets out of it. In the meantime, China's competitors are working hard to source rare earths of their own. The US is investing in mines in Australia; there's exploration ongoing in Malaysia, and the Japanese are researching ways to extract elements from mud mined from the sea bed.
We spoke to Laura Henderson Lewis, one of the professors on the Northeastern team, and she told us the material found in the meteorites is a combination of two base metals, nickel and iron, which were cooled over millions of years as meteoroids and asteroids tumbled through space. That process created a unique compound with a particular set of characteristics that make it ideal for use in the high-end permanent magnets that are an essential component of a vast range of advanced machines, from electric vehicles to space shuttle turbines.The compound is called tetrataenite, and the fact that scientists have found a way to make it in a lab is a huge deal. If synthetic tetrataenite works in industrial applications, it could make green energy technologies significantly cheaper. It could also roil the market in rare earths, currently dominated by China, and create a seismic shift in the industrial balance between China and the West....But it will be a long time before tetrataenite is in a position to disrupt any existing markets, Laura Lewis says. She says there is still a lot of testing to be done to find out whether lab tetrataenite is as hardy and as useful as the outer space material. And even if it turns out to be as good, it will be five to eight years "pedal to the metal" before anyone could make permanent magnets out of it. In the meantime, China's competitors are working hard to source rare earths of their own. The US is investing in mines in Australia; there's exploration ongoing in Malaysia, and the Japanese are researching ways to extract elements from mud mined from the sea bed.
8.000 millones de seres humanos en el Planeta Tierra (incluyendo diez que están en el espacio)POR @ALVY — 13 DE NOVIEMBRE DE 2022El planeta Tierra, con un eclipse sobre la Antártida / Foto (DP) NASA & DSCOVR EPICEn menos de 24 horas vamos a ser 8.000.000.000 seres humanos en el Planeta Tierra. Con nuestras alegrías, penas, amores, absurdeces y problemas… Este hito del MundoReal™ puede consultar uno de los contadores más conocidos, la clásica página del Worldometer, donde se ve cómo la cifra aumenta y aumenta rápida e inexorablemente hasta la redonda cifra.Y es que parece que fue ayer –que en realidad fue hace 11 años– cuando sobrepasamos otra cifra redonda: 7.000 millones. Para quien quiera hacerse una idea de cuánto espacio ocuparíamos ahora mismo si nos pusieran a todos juntos, juntitos, la gente de Meatball Studios creó una curiosa visualización. En realidad era una superficie de unos 82 x 29 km², tampoco parece tanto, aunque íbamos a estar como en el Metro a la hora punta de ir a la oficina.A este ritmo seguramente necesitaremos menos de una década para superar los 9.000 millones, y otra más para redondear a los 10.000 millones, momento en el que podremos hacer una gran fiesta… Si es que todavía tenemos planeta, que a este paso no se yo.
@Cadavre, a ver si este articulo vale la pena que sigue en los links ?https://elpais.com/elpais/2015/09/26/ciencia/1443295561_195929.html#?rel=lom
El libro 'Ja', escrito por un neurocientífico, repasa la ciencia de cuándo reímos y por quéManuel Ansede | 27 sept 2015El pato es el animal más gracioso, según un estudio científico.ReutersEl martes 30 de enero de 1962, tres alumnas de un internado religioso femenino en Kashasha (Tanzania) se echaron a reír. Su risa era tan contagiosa que las compañeras con las que se iban cruzando también se echaban a reír. La risa se propagaba aula tras aula, hasta infectar a la mitad de los presentes en el colegio. Casi un centenar de personas no podían parar de reír. Pasaron semanas y la gente se seguía riendo. La escuela tuvo que cerrar. Las chicas que regresaban a sus casas en otros pueblos contagiaban a sus vecinos. La epidemia de risa llegó a Nshamba, un pueblo de 10.000 habitantes, donde centenares de personas se echaron a reír. En total, 14 escuelas tuvieron que cerrar y 1.000 personas sufrieron brotes de risa incontenibles. La epidemia desapareció 18 meses después de su inicio y quedó descrita en un estudio científico de 1963 publicado en la revista especializada Central African Journal of Medicine.El caso lo recuerda el neurocientífico Scott Weems en su libro Ja. La ciencia de cuándo reímos y por qué, publicado por la editorial Taurus. “Ja trata de una idea. La idea es que el humor y su síntoma más corriente —la risa— son productos derivados de poseer un cerebro que se basa en el conflicto”, escribe Weems. El cerebro humano, explica, se adelanta constantemente a los acontecimientos y genera hipótesis. “Sin embargo, a veces conduce al conflicto, por ejemplo cuando intentamos sostener dos o más ideas contradictorias al mismo tiempo. Cuando eso ocurre, a nuestro cerebro solo se le ocurre una cosa: reírse”.Apoyado en una bibliografía de 135 estudios científicos, Weems describe el humor como “nuestra respuesta natural al conflicto y a la confusión”. El neurocientífico, formado en la Universidad de California en Los Ángeles (EE UU), recuerda que, tan solo una semana después de los atentados del 11 de septiembre de 2001, el humorista Gilbert Gottfried actuaba en el Friar’s Club de Nueva York. En la ciudad todavía olía a quemado. Los colegas que le habían precedido en el escenario no habían tocado el tema de los ataques terroristas. Se habían limitado a bromear sobre el tamaño del pene del invitado de honor de la noche, el fundador de la revista Playboy, Hugh Hefner. Pero Gottfried se vino arriba cuando el público celebró uno de sus chistes sobre musulmanes. Asomado al micrófono, proclamó:CitarUna epidemia de risa en Tanzania en 1962 obligó a cerrar 14 escuelas y afectó a un millar de personas—Esta noche tengo que irme pronto. Tengo que volar a Los Ángeles. No he podido conseguir un vuelo directo y he de hacer escala en el Empire State Building.Todo el mundo se quedó sin respiración. Al silencio siguieron los abucheos y los gritos de “¡Todavía es muy pronto para bromear sobre eso!”. Gottfried, un humorista con dos décadas de experiencia sobre el escenario, se enfrentaba a un público indignado, pero no se amilanó. Mirando a los asistentes, comenzó un nuevo chiste:—Muy bien. Un descubridor de talentos está sentado en su oficina . Entra una familia: un hombre, una mujer, dos hijos y un perrito. Así que el descubridor de talentos pregunta: “¿Qué clase de espectáculo hacen?”.Lo que siguió fue una sucesión de escatología, bestialismo, incesto y sexo depravado sin tabúes, “literalmente el chiste más guarro del mundo”, según Weems. El público estalló en carcajadas. “La actuación fue tan memorable que alguien realizó una película sobre el chiste, con la actuación de Gottfried como clímax, titulada Los aristócratas”, rememora.¿Cuándo se puede bromear sobre una tragedia? ¿Dónde están los límites del humor? Weems recuerda que en 1986, después de la explosión del transbordador espacial Challenger con siete tripulantes a bordo, se hizo muy popular un chiste: “¿Qué significan las siglas NASA? Necesitamos Ahora Siete Astronautas”. Un estudio mostró que los chistes sobre la tragedia surgieron unos 17 días después del accidente. La muerte de la princesa Diana de Gales tuvo un periodo de latencia más corto. Y el de los ataques terroristas del 11-S fue mucho más largo. El autor del estudio, Bill Ellis, de la Universidad del Estado de Pensilvania, clasificó los chistes sobre el Challenger por fecha y lugar de aparición. El accidente fue el 28 de enero de 1986. El 22 de febrero, en la ciudad de Shippensburg se contaba este chiste: ¿Sabes cuál es la bebida oficial de la Nasa? Seven Up (siete arriba, en inglés). CitarLos chistes sobre la tragedia del 'Challenger' surgieron unos 17 días después del accidente“Nuestra fascinación por el humor negro la demuestra la inmensa variedad de chistes de mal gusto: los que tienen con ver con el Challenger, el sida y Chernóbil, por nombrar solo unos pocos”, narra Weems. Armado con publicaciones en revistas especializadas, el neurocientífico sostiene que el humor negro no es cruel. “Inventar alternativas que expliquen el acrónimo sida resulta divertido para algunas personas, pero chillar ¡Ja, ja, estás enfermo! en un pabellón oncológico no resulta gracioso a nadie. Nos reímos de los chistes acerca de grupos o sucesos sólo cuando provocan reacciones emocionales complejas, porque sin esas reacciones no tenemos otra forma de responder”, reflexiona.“No hay un solo chiste que le agrade a todo el mundo. El humor es idiosincrásico porque depende de aquello que hace que todos seamos únicos: cómo nos enfrentamos a la discrepancia que reina en nuestro complejo cerebro”, subraya. La mejor prueba es un experimento llevado a cabo por el psicólogo Richard Wiseman, de la Universidad de Hertfordshire (Reino Unido). En 2001 abrió una web con la ayuda de la Asociación Británica para el Progreso de la Ciencia, con el objetivo de encontrar el chiste más gracioso del mundo. Recibió unos 40.000 chistes y un millón y medio de votaciones. El ganador fue:Dos cazadores de Nueva Jersey caminan por un bosque cuando uno de ellos se desploma. Da la impresión de que no respira y tiene los ojos vidriosos. El otro coge el teléfono y llama al servicio de emergencias. Dice con voz entrecortada: “¡Creo que mi amigo está muerto! ¿Qué debo hacer?”. El operador le contesta: “Cálmese. Le ayudaré. En primer lugar, asegúrese de que está muerto”. Hay un silencio y a continuación se oye un disparo. De nuevo al teléfono, el cazador dice: “Muy bien, y ahora ¿qué?”.El chiste más gracioso del mundo no tiene mucha gracia, coinciden Wiseman y Weems, y eso tiene una explicación científica. “Como no a todo el mundo le gusta por igual que los chistes sean provocadores, los más populares suelen agruparse cerca, aunque todavía debajo, del umbral de provocación más habitual. Si un chiste lo sobrepasa con mucho, algunas personas se troncharán de risa y otras no se reirán nada. Si queda demasiado corto, todos permanecerán fríos”, expone Weems.CitarEl animal más gracioso es el pato y la hora más descacharrante del día son las 18:03, según un estudioEl experimento de Wiseman sirvió para extraer unas cuantas conclusiones sobre los chistes. Los más divertidos tenían un promedio de 103 letras. El animal más gracioso era el pato. La hora más descacharrante del día son las 18:03. Y el día más chistoso del mes es el 15. En cuanto a nacionalidades, los estadounidenses mostraron “una clara afinidad por los chistes que incluían insultos o vagas amenazas”. Este chiste en inglés sobre un tejano y un graduado en Harvard fue muy apreciado en EE UU y poco fuera de sus fronteras:—Tejano: ¿De dónde eres? (Where are you from?)—Graduado de Harvard: De un lugar donde no terminamos las frases con una preposición.—Tejano: Muy bien, ¿de dónde eres, gilipollas? (Ok, where are you from, jackass?)Los europeos, en cambio, mostraron predilección por chistes absurdos o surrealistas, como este:Un paciente dice: “Doctor, ayer noche tuve un lapsus freudiano. Estaba cenando con mi suegra y quise decir: “¿Podrías pasarme la mantequilla?”. Pero en lugar de eso dije: “Vaca estúpida, me has destrozado completamente la vida”.Este otro chiste gustó a más de la mitad de los hombres, pero solo a un 15% de las mujeres:Un agente de policía para a un hombre que va por la autopista. El agente le pregunta: “¿Sabe que su mujer y su hijo se han caído del coche hace un kilómetro?”. El hombre sonríe y exclama: “¡Gracias a Dios! ¡Pensaba que me estaba quedando sordo!”.“El humor —especialmente el humor ofensivo— es idiosincrásico. Cada uno posee su propio umbral de lo que considera ofensivo y reacciona de manera muy diferente cuando se cruza ese umbral”, afirma Weems. En las páginas de Ja, el neurocientífico recuerda la teoría del médico Sigmund Freud de que el humor es nuestra manera de resolver el conflicto interior y la ansiedad. “Aunque hoy en día pocos científicos se toman en serio a Freud, casi todos reconocen que hay al menos algo de verdad en su teoría. Los chistes que no consiguen ni siquiera incomodarnos un poco no triunfan. Es el conflicto de querer reír, y al mismo tiempo no estar seguro de si deberíamos, lo que hace que los chistes sean satisfactorios”, señala Weems.En cuanto a la epidemia de risa de Tanzania, el autor cree que “sería fácil afirmar que las niñas simplemente experimentaron una crisis nerviosa”. Una interpretación sostiene que sufrieron una histeria colectiva causada por la tensión de un gran cambio social. En diciembre de 1961, el país se había independizado de Reino Unido y la escuela había abandonado la segregación racial. Además, las alumnas eran adolescentes, en plena pubertad, y las presiones eran tremendas, según destaca Weems.“Al pedirles que vivieran en dos mundos a la vez —ni británico ni africano, ni blanco ni negro, ni adulto ni niño, sino una combinación de ambas cosas— no consiguieron salir adelante. Pero la risa no es una crisis nerviosa. [...] Es un mecanismo de pugna, una manera de afrontar el conflicto. A veces ese conflicto se presenta en forma de chiste. A veces es algo más complicado”.
Una epidemia de risa en Tanzania en 1962 obligó a cerrar 14 escuelas y afectó a un millar de personas
Los chistes sobre la tragedia del 'Challenger' surgieron unos 17 días después del accidente
El animal más gracioso es el pato y la hora más descacharrante del día son las 18:03, según un estudio
MIT solved a century-old differential equation to break 'liquid' AI's computational bottleneckThe discovery could usher in a new generation of weather forecasting and autonomous vehicle driving virtual agents.A. Tarantola | @terrortola | November 15, 2022IGphotography via Getty ImagesLast year, MIT developed an AI/ML algorithm capable of learning and adapting to new information while on the job, not just during its initial training phase. These “liquid” neural networks (in the Bruce Lee sense) literally play 4D chess — their models requiring time-series data to operate — which makes them ideal for use in time-sensitive tasks like pacemaker monitoring, weather forecasting, investment forecasting, or autonomous vehicle navigation. But, the problem is that data throughput has become a bottleneck, and scaling these systems has become prohibitively expensive, computationally speaking.On Tuesday, MIT researchers announced that they have devised a solution to that restriction, not by widening the data pipeline but by solving a differential equation that has stumped mathematicians since 1907. Specifically, the team solved, “the differential equation behind the interaction of two neurons through synapses… to unlock a new type of fast and efficient artificial intelligence algorithms.”“The new machine learning models we call ‘CfC’s’ [closed-form Continuous-time] replace the differential equation defining the computation of the neuron with a closed form approximation, preserving the beautiful properties of liquid networks without the need for numerical integration,” MIT professor and CSAIL Director Daniela Rus said in a Tuesday press statement. “CfC models are causal, compact, explainable, and efficient to train and predict. They open the way to trustworthy machine learning for safety-critical applications.”So, for those of us without a doctorate in Really Hard Math, differential equations are formulas that can describe the state of a system at various discrete points or steps throughout the process. For example, if you have a robot arm moving from point A to B, you can use a differential equation to know where it is in between the two points in space at any given step within the process. However, solving these equations for every step quickly gets computationally expensive as well. MIT’s “closed form” solution end-arounds that issue by functionally modeling the entire description of a system in a single computational step. AS the MIT team explains:CitarImagine if you have an end-to-end neural network that receives driving input from a camera mounted on a car. The network is trained to generate outputs, like the car's steering angle. In 2020, the team solved this by using liquid neural networks with 19 nodes, so 19 neurons plus a small perception module could drive a car. A differential equation describes each node of that system. With the closed-form solution, if you replace it inside this network, it would give you the exact behavior, as it’s a good approximation of the actual dynamics of the system. They can thus solve the problem with an even lower number of neurons, which means it would be faster and less computationally expensive.By solving this equation at the neuron-level, the team is hopeful that they’ll be able to construct models of the human brain that measure in the millions of neural connections, something not possible today. The team also notes that this CfC model might be able to take the visual training it learned in one environment and apply it to a wholly new situation without additional work, what’s known as out-of-distribution generalization. That’s not something current-gen models can really do and would prove to be a significant step towards the generalized AI systems of tomorrow.
Imagine if you have an end-to-end neural network that receives driving input from a camera mounted on a car. The network is trained to generate outputs, like the car's steering angle. In 2020, the team solved this by using liquid neural networks with 19 nodes, so 19 neurons plus a small perception module could drive a car. A differential equation describes each node of that system. With the closed-form solution, if you replace it inside this network, it would give you the exact behavior, as it’s a good approximation of the actual dynamics of the system. They can thus solve the problem with an even lower number of neurons, which means it would be faster and less computationally expensive.
CICERO: An AI agent that negotiates, persuades, and cooperates with peopleNovember 22, 2022Games have long been a proving ground for new AI advancements — from Deep Blue’s victory over chess grandmaster Garry Kasparov, to AlphaGo’s mastery of Go, to Pluribus out-bluffing the best humans in poker. But truly useful, versatile agents will need to go beyond just moving pieces on a board. Can we build more effective and flexible agents that can use language to negotiate, persuade, and work with people to achieve strategic goals similar to the way humans do?Today, we’re announcing a breakthrough toward building AI that has mastered these skills. We’ve built an agent – CICERO – that is the first AI to achieve human-level performance in the popular strategy game Diplomacy*. CICERO demonstrated this by playing on webDiplomacy.net, an online version of the game, where CICERO achieved more than double the average score of the human players and ranked in the top 10 percent of participants who played more than one game.Diplomacy has been viewed for decades as a near-impossible grand challenge in AI because it requires players to master the art of understanding other people’s motivations and perspectives; make complex plans and adjust strategies; and then use natural language to reach agreements with other people, convince them to form partnerships and alliances, and more. CICERO is so effective at using natural language to negotiate with people in Diplomacy that they often favored working with CICERO over other human participants.Unlike games like Chess and Go, Diplomacy is a game about people rather than pieces. If an agent can't recognize that someone is likely bluffing or that another player would see a certain move as aggressive, it will quickly lose the game. Likewise, if it doesn't talk like a real person -- showing empathy, building relationships, and speaking knowledgeably about the game -- it won't find other players willing to work with it.The key to our achievement was developing new techniques at the intersection of two completely different areas of AI research: strategic reasoning, as used in agents like AlphaGo and Pluribus, and natural language processing, as used in models like GPT-3, BlenderBot 3, LaMDA, and OPT-175B. CICERO can deduce, for example, that later in the game it will need the support of one particular player, and then craft a strategy to win that person’s favor – and even recognize the risks and opportunities that that player sees from their particular point of view.We’ve open-sourced the code and published a paper to help the wider AI community use CICERO to spur further progress in human-AI cooperation. You can also visit the CICERO website to learn more about the project and see the agent in action. Interested researchers can submit a proposal to the CICERO RFP to gain access to the data.Under the hood: How we built CICEROAt the heart of CICERO is a controllable dialogue model for Diplomacy coupled with a strategic reasoning engine. At each point in the game, CICERO looks at the game board and its conversation history, and models how the other players are likely to act. It then uses this plan to control a language model that can generate free-form dialogue, informing other players of its plans and proposing reasonable actions for the other players that coordinate well with them.Controllable dialogueTo build a controllable dialogue model, we started with a 2.7 billion parameter BART-like language model pre-trained on text from the internet and fine tuned on over 40,000 human games on webDiplomacy.net. We developed techniques to automatically annotate messages in the training data with corresponding planned moves in the game, so that at inference time we can control dialogue generation to discuss specific desired actions for the agent and its conversation partners. For example, if our agent is playing as France, conditioning the dialogue model on a plan involving England supporting France into Burgundy might yield a message to England like, “Hi England! Are you willing to support me into Burgundy this turn?” Controlling generation in this manner allows Cicero to ground its conversations in a set of plans that it develops and revises over time to better negotiate. This helps the agent coordinate with and persuade other players more effectively.Step 1 Using the board state and current dialogue, Cicero makes an initial prediction of what everyone will do.Step 2 CICERO iteratively refines that prediction using planning and then uses those predictions to form an intent for itself and its partner.Step 3 It generates several candidate messages based on the board state, dialogue, and its intents.Step 4 It filters the candidate message to reduce nonsense, maximize value, and ensure consistency with our intents.We further improve dialogue quality using several filtering mechanisms – such as classifiers trained to distinguish between human and model-generated text – that ensure that our dialogue is sensible, consistent with the current game state and previous messages, and strategically sound.Dialogue-aware strategy & planningPast superhuman agents in adversarial games like chess, Go, and poker were created through self-play reinforcement learning (RL) – having the agents learn optimal policies by playing millions of games against other copies of itself. However, games involving cooperation require modeling what humans will actually do in real life, rather than modeling what they should do if they were perfect copies of the bot. In particular, we want CICERO to make plans that are consistent with its dialogue with other players.The classic approach to human modeling is supervised learning, where the agent is trained with labeled data such as a database of human players’ actions in past games. However, relying purely on supervised learning to choose actions based on past dialogue results in an agent that is relatively weak and highly exploitable. For example, a player could tell the agent, "I'm glad we agreed that you will move your unit out of Paris!" Since similar messages appear in the training data only when an agreement was reached, the agent might indeed move its unit out of Paris even if doing so is a clear strategic blunder.To fix this, CICERO runs an iterative planning algorithm that balances dialogue consistency with rationality. The agent first predicts everyone's policy for the current turn based on the dialogue it has shared with other players, and also predicts what other players think the agent's policy will be. It then runs a planning algorithm we developed called piKL, which iteratively improves these predictions by trying to choose new policies that have higher expected value given the other players' predicted policies, while also trying to keep the new predictions close to the original policy predictions. We found that piKL better models human play and leads to better policies for the agent compared to supervised learning alone.Generating natural, purposeful dialogueIn Diplomacy, how a player talks to other people can be even more important than how they move their pieces. CICERO is able to speak clearly and persuasively when strategizing with other players. For example, in one demonstration game CICERO asked one player for immediate support on one part of the board while pressing another to consider an alliance later in the game.In these exchanges, CICERO tries to execute its strategy by proposing moves to three different players. In the second dialog, the agent is able to tell the other player why they should cooperate and how it will be mutually beneficial. In the third, CICERO is both soliciting information and setting the groundwork for future moves.Where there is still room for improvementIt is important to recognize that CICERO also sometimes generates inconsistent dialogue that can undermine its objectives. In the example below where CICERO was playing as Austria, the agent contradicts its first message asking Italy to move to Venice. While our suite of filters aims to detect these sorts of mistakes, it is not perfect.Diplomacy as a sandbox for advancing human-AI interactionThe emergence of goal-oriented dialogue systems in a game that involves both cooperation and competition raises important social and technical challenges in aligning AI with human intentions and objectives. Diplomacy provides a particularly interesting environment for studying this because playing the game requires wrestling with conflicting objectives and translating those complex goals into natural language. As a simple example, a player might choose to compromise on short term gains in order to maintain an ally, on the chance that this ally will help them into an even better position on the next turn.While we’ve made significant headway in this work, both the ability to robustly align language models with specific intentions and the technical (and normative) challenge of deciding on those intentions remain open and important problems. By open sourcing the CICERO code, we hope that AI researchers can continue to build off our work in a responsible manner. We have made early steps towards detecting and removing toxic messages in this new domain by using our dialogue model for zero-shot classification. We hope Diplomacy can serve as a safe sandbox to advance research in human-AI interaction.Future directionsWhile CICERO is only capable of playing Diplomacy, the technology behind this achievement is relevant to many real world applications. Controlling natural language generation via planning and RL, could, for example, ease communication barriers between humans and AI-powered agents. For instance, today's AI assistants excel at simple question-answering tasks, like telling you the weather, but what if they could maintain a long-term conversation with the goal of teaching you a new skill? Alternatively, imagine a video game in which the non player characters (NPCs) could plan and converse like people do — understanding your motivations and adapting the conversation accordingly — to help you on your quest of storming the castle.We’re excited about the potential for future advances in these areas and seeing how others build on our research.Read the paperVisit the CICERO siteLearn about the RFPWe’d like to acknowledge the contributions of a broad team to this work: Anton Bakhtin, Noam Brown, Emily Dinan, Gabriele Farina, Colin Flaherty, Daniel Fried, Andrew Goff, Jonathan Gray, Hengyuan Hu, Athul Paul Jacob, Mojtaba Komeili, Karthik Konath, Adam Lerer, Mike Lewis, Alexander H. Miller, Sasha Mitts, Adithya Renduchintala, Stephen Roller, Dirk Rowe, Weiyan Shi, Joe Spisak, Alexander Wei, David Wu, Hugh Zhang, Markus Zijlstra, Ana Paula Kirschner Mofarrej, Anne Davidson, Oliver Libaw, Amanda Felix, Karla Caraballo-Torres, Christopher Johnson, Lydia Baillergeau, Julia Vargas, Eric Kaplan, Raghu Nayani, Aiman Farooq, Andrea Cheung, Emily Astbury, Gopika Jhala, Jon Carvill, Jon Shepard, Josh Terry, Marina Zannoli, Nathan Riley, Michelle Restrepo, Noah Rizk, Ritika Trikha, Steph Miles, Tamara Piksa, Zara Blum, Daniel Duncan, Antoine Bordes, Laurens van der Maaten, Alex Boesenberg, Korey Anvaripour, Somya Jain, Harrison Rudolph, Michael Friedrichs, Elisabeth Sperle, and Cesar Guiterrez.* All rights in Diplomacy are owned by Hasbro, Inc.
La electricidad barata e ilimitada arrancará en 2028 y no será la fusiónÉstas son las primera imágenes de la central térmica de Quaise, que usará una perforadora de plasma para acceder al magma a gran profundidad y obtener energía ilimitada y barata
Investigadores descifran carta con “código diabólico” de Carlos V que fue un enigma por cinco siglosLa misteriosa misiva fue escrita por el emperador en 1547 y contenía trampas que nunca habían logrado resolversehttps://www.larazon.es/cultura/historia/20221126/65kp2qd4lbas7k7amfozd65an4.html